双榜第一！文心5.1登顶中文创意写作综合实力评测-大旗号

【大力财经】5月18日，全球权威ICT领域市场研究机构Omdia发布《2026 年基础模型中文创意写作能力评估》报告，围绕中文创意写作七大核心维度，对 DeepSeek V4、文心5.1（ERNIE 5.1）、GPT 5.5 等 8大国内外主流顶级文本模型展开专业评估。结果显示，百度文心5.1 成为唯一独占四项最高评级的模型，稳居中文创意写作领域综合实力之首，是为综合实力最强的市场领导者。

评估报告聚焦中文场景核心需求，从创造力和原创性、叙事质量、语言风格、整体一致性、内容安全、市场影响、合作伙伴和生态七大维度，对参评模型进行全维度、高标准验证，具备较高行业参考价值。百度文心5.1 则分别在创意和原创性、语言风格、整体一致性、内容安全四大关键维度斩获最高评级，是参与评估的八款模型中唯一达成此项成就的模型。

相较之下，DeepSeek V4、GPT 5.5 等模型虽在部分维度表现优异，但在中文语境理解、文化内涵把握、多维度均衡表现等维度存在短板，未能实现多维度顶级评级全覆盖。文心 5.1 凭借对中文文化底蕴、语言逻辑及创作规律的深度深耕，已在本土创意写作场景中形成显著优势竞争力。

同日，中文原生创意写作专项测评基准（SuperCLUE-Writing）正式发布，文心 5.1 同样以 87.57 分位列创意写作国内第一、全球第二，在综合表现上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等国内外主流模型。

此前文心 5.1 已在LMArena 搜索榜斩获国内第一、全球第四，预训练成本仅为业界同规模模型的 6%，兼具高性能与低成本优势；4月30日，文心5.1 Preview还登上了LMArena 文本榜国内第一，是榜单前十五名中唯一入围的国产模型。

全球大模型竞技场Arena引用最新斯坦福人工智能指数称，自2025年初以来，中美大模型多次交替领先，目前整体差距已缩小至约 2.7%。在最受关注的文本赛道中，美国表现最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking，中国则是以百度的文心 5.1 为代表。

业内人士表示，文本能力仍是基础模型最核心的底层能力之一。文心5.1在多个权威榜单和评测中的表现，体现了其在文本理解、语言生成等基础能力上的积累，也反映出基础模型能力建设的重要性。

自变量密集融资背后：看见一份更密集的落地“成绩单”

把技术兑现成产品和场景

2026-07-03

一万个“斜杠店员”开播，商场正在抖音重做增长

内容拉动增长新时代

2026-07-03

蚂蚁集团入局具身智能，领投乐享科技，韩歆毅在下一步什么大棋？

2026-07-03

携手亚马逊云科技，影石Insta360解锁极速AI创作新范式

“拍摄1分钟、剪辑3小时、分享等半天”，这一直是一众“出片”爱好者的困扰。作为世界领先的全景相机品牌，影石Insta360不仅持续推出革新性产品，也始终致力于为用户带来更丰富、更流畅的服务与体验。影石Insta360云存业务负责人林思远表示，影石Insta360基于

2026-07-02

从像素复刻到行动控制：具身世界模型的底层逻辑探索
2026-07-02

入局AI算力储能、牵手施耐德，康迪科技在下一步很大的棋

出品 / 明湖财经丨江泓Meta的AI训练集群曾经因为一次47秒的供电中断，直接损失6500万美元。1万张GPU训练任务同步丢失，三周的模型进度化为乌有。这事儿发生在2025年，不是电影情节，是真实事故。AI算力对供电可靠性的依赖到了极端程度。当前全球AI数据中心的

2026-07-02

优必选CEO称20年后全是机器人干活

近日，在优必选2026年度全球发布会上，优必选CEO周剑再次谈及机器人产业的发展前景，并对未来20年的人类工作方式作出预测。周剑表示：“好好珍惜我们作为牛马、作为劳动力工作的最后光阴吧，这也就是未来5年、10年、20年的事情了。”他认为，现在二十多岁的年

2026-07-02