大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

双榜第一!文心5.1登顶中文创意写作综合实力评测

大力财经 2026-05-20

【大力财经】5月18日,全球权威ICT领域市场研究机构Omdia发布《2026 年基础模型中文创意写作能力评估》报告,围绕中文创意写作七大核心维度,对 DeepSeek V4、文心5.1(ERNIE 5.1)、GPT 5.5 等 8大国内外主流顶级文本模型展开专业评估。结果显示,百度文心5.1 成为唯一独占四项最高评级的模型,稳居中文创意写作领域综合实力之首,是为综合实力最强的市场领导者。

评估报告聚焦中文场景核心需求,从创造力和原创性、叙事质量、语言风格、整体一致性、内容安全、市场影响、合作伙伴和生态七大维度,对参评模型进行全维度、高标准验证,具备较高行业参考价值。百度文心5.1 则分别在创意和原创性、语言风格、整体一致性、内容安全四大关键维度斩获最高评级,是参与评估的八款模型中唯一达成此项成就的模型。

相较之下,DeepSeek V4、GPT 5.5 等模型虽在部分维度表现优异,但在中文语境理解、文化内涵把握、多维度均衡表现等维度存在短板,未能实现多维度顶级评级全覆盖。文心 5.1 凭借对中文文化底蕴、语言逻辑及创作规律的深度深耕,已在本土创意写作场景中形成显著优势竞争力。

同日,中文原生创意写作专项测评基准(SuperCLUE-Writing)正式发布,文心 5.1 同样以 87.57 分位列创意写作国内第一、全球第二,在综合表现上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等国内外主流模型。

此前文心 5.1 已在LMArena 搜索榜斩获国内第一、全球第四,预训练成本仅为业界同规模模型的 6%,兼具高性能与低成本优势;4月30日,文心5.1 Preview还登上了LMArena 文本榜国内第一,是榜单前十五名中唯一入围的国产模型。

全球大模型竞技场Arena引用最新斯坦福人工智能指数称,自2025年初以来,中美大模型多次交替领先,目前整体差距已缩小至约 2.7%。在最受关注的文本赛道中,美国表现最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking,中国则是以百度的文心 5.1 为代表。

业内人士表示,文本能力仍是基础模型最核心的底层能力之一。文心5.1在多个权威榜单和评测中的表现,体现了其在文本理解、语言生成等基础能力上的积累,也反映出基础模型能力建设的重要性。

蚂蚁集团入局具身智能,领投乐享科技,韩歆毅在下一步什么大棋?
作者:海右声明:图片由网界拍摄,版权所有;网界原创文章,如需转载请留言申请开白。7月2日,投资圈再次落下一记重锤。苏州乐享科技完成近5亿元Pre-A轮融资,蚂蚁集团领投。这家成立才一年半的公司,累计融资总额已经到了10亿元。对于一个还没有量产交付的机

2026-07-03

携手亚马逊云科技,影石Insta360解锁极速AI创作新范式
“拍摄1分钟、剪辑3小时、分享等半天”,这一直是一众“出片”爱好者的困扰。作为世界领先的全景相机品牌,影石Insta360不仅持续推出革新性产品,也始终致力于为用户带来更丰富、更流畅的服务与体验。影石Insta360云存业务负责人林思远表示,影石Insta360基于

2026-07-02

入局AI算力储能、牵手施耐德,康迪科技在下一步很大的棋
出品 / 明湖财经丨江泓Meta的AI训练集群曾经因为一次47秒的供电中断,直接损失6500万美元。1万张GPU训练任务同步丢失,三周的模型进度化为乌有。这事儿发生在2025年,不是电影情节,是真实事故。AI算力对供电可靠性的依赖到了极端程度。当前全球AI数据中心的

2026-07-02

优必选CEO称20年后全是机器人干活
近日,在优必选2026年度全球发布会上,优必选CEO周剑再次谈及机器人产业的发展前景,并对未来20年的人类工作方式作出预测。周剑表示:“好好珍惜我们作为牛马、作为劳动力工作的最后光阴吧,这也就是未来5年、10年、20年的事情了。”他认为,现在二十多岁的年

2026-07-02