今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。
在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,Humaneval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。
而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。
据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。
300万焊工缺口背后,“中国制造”遇见“具身红利”
文 | 智能相对论作者 | 叶远风2026年5月,北京唯实国际文化交流中心,一场没有聚光灯追逐的签约仪式悄然完成。签约双方是小雨智造与中建科工智能科技,协议内容异常具体:未来一年内,共同推进1000台级具身智能焊接机器人在建筑钢结构领域的规模化应用。而不
2026-05-14
湖北首家华为产教融合全国样板点落地武汉华夏理工学院
AI越“智能”,人才越“稀缺”——这并非悖论,而是当下高质量ICT人才市场的真实写照。毕马威《2026年全球技术报告》提供了有力佐证:53%的企业缺乏实现数智化转型所需人才,而能驾驭AI的高端人才供给,更是远远跟不上岗位扩张速度。如果说高质量ICT人才是数
2026-05-14
阿里 AI 应用新进展:悟空开始逐步规模化放量
5月13日,阿里巴巴集团发布2026财年Q4及全年财报。财报表示,阿里全栈AI技术投入已正式跨越初期培育阶段,进入正向的规模商业化回报周期。在财年第四季度,阿里 AI 在模型、云基础设施和应用各层实现加速突破。在 AI to B 方向,阿里旗下企业级Agent平台“悟
2026-05-14
从罗永浩到帕梅拉,百度一镜让数字人进入规模化商用时代
2026年5月13日,北京国家会议中心Create 2026百度AI开发者大会现场气氛热烈。主视觉大屏持续呈现数字人实时生成、多智能体协同作业的动态画面,台下聚集着来自全球的科技从业者、品牌方、跨境商家与财经科技媒体。今年的Create大会与往年不同,没有技术炫技,
2026-05-14