大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

双榜第一!文心5.1登顶中文创意写作综合实力评测

大力财经 2026-05-20

【大力财经】5月18日,全球权威ICT领域市场研究机构Omdia发布《2026 年基础模型中文创意写作能力评估》报告,围绕中文创意写作七大核心维度,对 DeepSeek V4、文心5.1(ERNIE 5.1)、GPT 5.5 等 8大国内外主流顶级文本模型展开专业评估。结果显示,百度文心5.1 成为唯一独占四项最高评级的模型,稳居中文创意写作领域综合实力之首,是为综合实力最强的市场领导者。

评估报告聚焦中文场景核心需求,从创造力和原创性、叙事质量、语言风格、整体一致性、内容安全、市场影响、合作伙伴和生态七大维度,对参评模型进行全维度、高标准验证,具备较高行业参考价值。百度文心5.1 则分别在创意和原创性、语言风格、整体一致性、内容安全四大关键维度斩获最高评级,是参与评估的八款模型中唯一达成此项成就的模型。

相较之下,DeepSeek V4、GPT 5.5 等模型虽在部分维度表现优异,但在中文语境理解、文化内涵把握、多维度均衡表现等维度存在短板,未能实现多维度顶级评级全覆盖。文心 5.1 凭借对中文文化底蕴、语言逻辑及创作规律的深度深耕,已在本土创意写作场景中形成显著优势竞争力。

同日,中文原生创意写作专项测评基准(SuperCLUE-Writing)正式发布,文心 5.1 同样以 87.57 分位列创意写作国内第一、全球第二,在综合表现上超越 Gemini-3.1-Pro-Preview、GPT-5.5(xhigh)、DeepSeek-V4-Pro(max) 等国内外主流模型。

此前文心 5.1 已在LMArena 搜索榜斩获国内第一、全球第四,预训练成本仅为业界同规模模型的 6%,兼具高性能与低成本优势;4月30日,文心5.1 Preview还登上了LMArena 文本榜国内第一,是榜单前十五名中唯一入围的国产模型。

全球大模型竞技场Arena引用最新斯坦福人工智能指数称,自2025年初以来,中美大模型多次交替领先,目前整体差距已缩小至约 2.7%。在最受关注的文本赛道中,美国表现最突出的仍是 Anthropic 的 Claude Opus 4.6 Thinking,中国则是以百度的文心 5.1 为代表。

业内人士表示,文本能力仍是基础模型最核心的底层能力之一。文心5.1在多个权威榜单和评测中的表现,体现了其在文本理解、语言生成等基础能力上的积累,也反映出基础模型能力建设的重要性。

九牧智能马桶亚洲第一,中国品牌出海大跃进
作者 | 曾响铃文 | 响铃说随着张雪机车在WSBK赛场的连续夺冠,爆单了。有媒体报答,在前两次夺冠后,就收到了‌1000余台海外订单,欧洲市场意向订单总量超3000台。最近有又消息指出,大疆以70%的市场占有率,垄断全球无人机市场。中国制造在海外市场掀起的一

2026-05-19

抖音生活服务推出“出单宝”:出单全托管,核销才计费
5月18日,抖音生活服务正式发布全新智能托管产品“出单宝”。作为平台服务本地生活服务商家的新举措,“出单宝”创新采用出单全托管,核销才计费的模式,为中小商家提供一体化营销解决方案,简化线上营销流程、降低数字化经营门槛。抖音生活服务测试数据显示

2026-05-19

纳米大片流水线亮相2026AI短剧/漫剧生态发展交流会 实现“漫剧”向“大片”的质感升维
5月16日,由中国广告协会指导,IAB China微短剧短视频专业委员会、中国广告协会内容营销及广告代言人工作委员会主办,短剧新势力、青芒时代短剧协办的「AI新势能,漫剧正当红」2026AI短剧/漫剧生态发展交流会,在西安西咸国际会议中心盛大召开。作为西北首个A

2026-05-18

石头科技发布2026Q1财报:股价下跌七成,机构下调预期
石头科技在近期正式发布了2025年年度报告与2026年一季度财报。但这显然是一份充满矛盾与危险信号的成绩单,让这家曾经凭硬核技术封神的扫地机器人龙头,彻底站在舆论风口。2025年,公司全年营收实现82.34 亿元,同比大涨 24.12%,收入规模一路冲高;可归母净

2026-05-18