今日,据媒体报道,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。
在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,Humaneval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。
而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。
据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。
营收破百亿!泡泡玛特:全球化多点布局,用实力诠释「潮玩无界」
文 / 大力财经2025 年 3 月26,泡泡玛特正式发布 2024 年年报,这份财报不仅展示了过去一年的经营成果,更透露了潮玩行业的发展趋势。作为潮玩界的 “扛把子”,泡泡玛特此次的财报数据究竟成色如何?又能给行业带来哪些启示?下面让我们一起来深入解读。一、
2025-03-26
2025AWE观察:当中国厨房遇上“数字味觉”与“东方美学”
文 | 智能相对论作者 | 佘凯文在2025年的上海新国际博览中心,一场关于未来厨房的“数字革命”正在上演。AWE 2025的展台上,智能屏幕与中式美学的交织、AI算法与传统烹饪的碰撞,彰显出AI时代下厨电行业的“野心勃勃”。各大厨电品牌都在“屏幕”重塑厨房交互
2025-03-26
中国AI低调两连发引热议,阿里千问与DeepSeek携手上架魔搭社区
3月26日,中国AI又给全球开源社区带来了新惊喜——阿里通义千问与DeepSeek,均于昨日低调开源了两款新模型:阿里发布了更适合本地部署的高性能「多模态模型」Qwen2.5-VL-32B,DeepSeek则将此前热门的「基座模型」V3更新到0324版本,并官宣在魔搭社区上架开源
2025-03-26
美团2024年财报:无人机配送超45万单,研发投入211亿元
3月21日,美团(股票代码:3690.HK)发布2024年第四季度及全年业绩。受益于国内消费信心提振、消费潜力释放,公司各项业务取得稳健增长,全年营收3376亿元(人民币,下同),同比增长22%。2024年,美团继续围绕“零售+科技”战略,持续加大对中国消费市场及科技研
2025-03-25