大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

超越Deepseek!文心大模型X1代码、数学、推理等能力大幅提升

ITBEAR科技资讯 2025-03-26

今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,Humaneval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


300万焊工缺口背后,“中国制造”遇见“具身红利”
文 | 智能相对论作者 | 叶远风2026年5月,北京唯实国际文化交流中心,一场没有聚光灯追逐的签约仪式悄然完成。签约双方是小雨智造与中建科工智能科技,协议内容异常具体:未来一年内,共同推进1000台级具身智能焊接机器人在建筑钢结构领域的规模化应用。而不

2026-05-14

湖北首家华为产教融合全国样板点落地武汉华夏理工学院
AI越“智能”,人才越“稀缺”——这并非悖论,而是当下高质量ICT人才市场的真实写照。毕马威《2026年全球技术报告》提供了有力佐证:53%的企业缺乏实现数智化转型所需人才,而能驾驭AI的高端人才供给,更是远远跟不上岗位扩张速度。如果说高质量ICT人才是数

2026-05-14

星河问途总裁孙晓龙荣获2026世界品牌莫干山大会“人工智能+”创新人物称号
5月9日,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事”正式发布《“人工智能+”生态创新实践范本》。星河问途(苏州)智能科技有限公司总裁孙晓龙凭借在“人工智能+自动驾驶”领域的持续创新实践与产业化成果,荣获2026“人工智能+”创新人物称号。

2026-05-14

阿里 AI 应用新进展:悟空开始逐步规模化放量
5月13日,阿里巴巴集团发布2026财年Q4及全年财报。财报表示,阿里全栈AI技术投入已正式跨越初期培育阶段,进入正向的规模商业化回报周期。在财年第四季度,阿里 AI 在模型、云基础设施和应用各层实现加速突破。在 AI to B 方向,阿里旗下企业级Agent平台“悟

2026-05-14

从罗永浩到帕梅拉,百度一镜让数字人进入规模化商用时代
2026年5月13日,北京国家会议中心Create 2026百度AI开发者大会现场气氛热烈。主视觉大屏持续呈现数字人实时生成、多智能体协同作业的动态画面,台下聚集着来自全球的科技从业者、品牌方、跨境商家与财经科技媒体。今年的Create大会与往年不同,没有技术炫技,

2026-05-14