大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

LMArena最新排名:文心大模型5.0 Preview文本能力位居国内第一

大力财经 2025-12-23

 

12月23日,LMArena 大模型竞技场发布最新排名,文心新模型 ERNIE-5.0-Preview-1203 以 1451 分登上 LMArena 文本榜,排名中国第一。在创意写作、高难度指令等方面表现突出,超过Claude-Opus-4-1、GPT-5.2、GPT-5.1、和Qwen3-Max-Preview等多款国内外主流模型。

在创意写作及复杂任务场景中,ERNIE-5.0-Preview-1203 能够准确理解用户需求,生成结构清晰、逻辑一致的文本内容。据知情人士透露,文心大模型5.0正式版将于1月上线。

公开资料显示,文心大模型于2019年首次对外发布,文心大模型5.0是百度今年11月发布的原生全模态大模型。该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。

此前,文心大模型 5.0 Preview 在 LMArena 文本榜中位居全球并列第二、中国第一,超过GPT-5-High等多款国内外主流模型;同时,在 LMArena 视觉理解榜中位居国内第一,整体表现与 Claude-Sonnet-4、GPT-5-High 相当。


Quest Mobile发布AI应用周活排行榜:字节系上榜3个,蚂蚁上榜2个
12月23日,研究机构Quest Mobile发布的《2025下半年AI应用交互革新与生态落地报告》显示,全市场AI原生App中,最新周活跃用户排名前四的是豆包、DeepSeek、元宝、蚂蚁阿福,阿里千问位列第五,蚂蚁集团11月发布的通用AI助手灵光,进入前十。Quest Mobile榜单

2025-12-23

黄仁勋断言AI下一波浪潮是物理AI,中国企业谁是赢家?
近期,全球科技企业集体跑步入局物理AI:OpenAI从ChatGPT 向世界模型发展;阿里千问APP近日开始接入高德,让其具备物理世界的理解和行动能力;小米大模型负责人罗福莉近期表示AI 进化的下一个关键点,一定是能够与真实环境持续交互的物理模型……“物理AI时代

2025-12-22