【大力财经】5月18日,全球权威ICT领域市场研究机构Omdia发布《2026 年基础模型中文创意写作能力评估》报告,围绕中文创意写作七大核心维度,对 DeepSeek V4、文心5.1(ERNIE 5.1)、GPT 5.5 等 8大国内外主流顶级文本模型展开专业评估。结果显示,百度文心5.1 成为唯一独占四项最高评级的模型,稳居中文创意写作领域综合实力之首,是为综合实力最强的市场领导者。

评估报告聚焦中文场景核心需求,从创造力和原创性、叙事质量、语言风格、整体一致性、内容安全、市场影响、合作伙伴和生态七大维度,对参评模型进行全维度、高标准验证,具备较高行业参考价值。百度文心5.1 则分别在创意和原创性、语言风格、整体一致性、内容安全四大关键维度斩获最高评级,是参与评估的八款模型中唯一达成此项成就的模型。
相较之下,DeepSeek V4、GPT 5.5 等模型虽在部分维度表现优异,但在中文语境理解、文化内涵把握、多维度均衡表现等维度存在短板,未能实现多维度顶级评级全覆盖。文心 5.1 凭借对中文文化底蕴、语言逻辑及创作规律的深度深耕,已在本土创意写作场景中形成显著优势竞争力。
同日,中文原生创意写作专项测评基准(SuperCLUE-Writing)正式发布,文心 5.1 同样以 87.57 分位列创意写作国内第一、全球第二,在综合表现上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等国内外主流模型。

此前文心 5.1 已在LMArena 搜索榜斩获国内第一、全球第四,预训练成本仅为业界同规模模型的 6%,兼具高性能与低成本优势;4月30日,文心5.1 Preview还登上了LMArena 文本榜国内第一,是榜单前十五名中唯一入围的国产模型。
全球大模型竞技场Arena引用最新斯坦福人工智能指数称,自2025年初以来,中美大模型多次交替领先,目前整体差距已缩小至约 2.7%。在最受关注的文本赛道中,美国表现最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking,中国则是以百度的文心 5.1 为代表。
业内人士表示,文本能力仍是基础模型最核心的底层能力之一。文心5.1在多个权威榜单和评测中的表现,体现了其在文本理解、语言生成等基础能力上的积累,也反映出基础模型能力建设的重要性。





