
出品 | 大力财经
作者 | 魏力
5月13日,在Create2026百度AI开发者大会上,百度创始人李彦宏首次提出了AI时代的"度量衡"——日活智能体数(DAA)。

他认为,进入智能体时代,衡量一个平台和生态是否繁荣,不应该再只看用户数或模型参数,而应该关注DAA,关注有多少Agent在真正给人类干活、交付结果。与此同时,他强调应对智能体的爆发,需要构建"芯云模体"全栈能力。
在此背景下,百度集团执行副总裁、百度智能云事业群总裁沈抖正式宣布,基于百度在昆仑芯、AI云、文心大模型、智能体等方面的丰富实践,百度智能云将全面升级为面向大规模智能体应用的新全栈AI云,目标是打造单位Token智能水平最好的Agent Infra和每瓦性能更强、性价比更高的AI Infra,帮助企业客户和超级个体拥有稳定运行、持续进化、可管可控的智能体服务。
这次全面升级围绕Agent Infra与AI Infra两条主线展开。在Agent Infra方面,原有的"MaaS模型服务"已升级为"Token Factory词元工厂",以Agent-first理念重构产品架构,尽可能减少token重复计算,推理生成速度较市场平均水平提升约25%。

其底层算力采用百度自研昆仑芯,支持文心、DeepSeek、GLM、MiniMax等国产主流模型的调用,提供更具性价比的token服务。与此同时,百度智能云还推出了"Harness Engineering驾驭工程",覆盖长上下文管理、持久记忆、工具调用、子智能体调度、评估反馈及Runtime等能力模块,并对各模块进行深度协同优化,深度适配Office、浏览器等企业常用工具,稳定运行成功率达到95%,相比OpenClaw最高可减少23%的token消耗。
在AI Infra层面,百度智能云同样取得了突破性进展。通过对显存、内存到SSD的分层池化架构,KV Cache命中率超过90%,达到业界最高水平。结合AFD分离、PD分离、缓存调度等优化方案,长链路Agent推理性能较主流开源社区引擎提升3倍。全模态统一训练框架让训练效率领先行业1倍,强化学习采样环境可在100毫秒内大规模拉起。

在算力硬件方面,昆仑芯P800已完成规模化验证,2025年至今已交付多个万卡集群。在昆仑芯全国产集群上,已成功完成对文心5.1重要模型的训练,整个集群有效训练率达到97%,万卡规模集群线性扩展度超过85%。此外,基于昆仑芯的天池256卡超节点将于6月正式上市,吞吐性能较上一代提升25%,推理效率提升50%。网络架构升级至HPN5.0,端到端时延优化50%,支持按需搭建数十万卡乃至百万卡超大集群。
百度还公布了吉瓦级AIDC超大集群升级方案,通过"网络向心布局"设计理念,让数据中心整体建设周期缩短约30%。

基于这套新全栈AI云,百度智能云已在多个行业落地。在国货出海领域,百度首次公开了企业级智能营销解决方案Hogee和数字厂长"一见Claw",正帮助义乌"前店后厂"商家迭代为"AI工厂"。在汽车行业,百度智能云已成为100%中国主流车企的选择,去年共支持2000万辆L2级辅助驾驶新车交付。

在AI硬件和具身智能领域,百度智能云总计服务超1000家AI硬件厂商,具身智能AI云市场份额超过第二、第三名之和。在金融领域,昆仑芯助力招商银行建立国产算力底座,并为浦发银行精调财务分析专精模型。此外,百度智能云目前服务了超80%的央企。
沈抖表示,中国有最完整的产业体系和最丰富的应用场景,未来可能诞生超过100亿活跃智能体,各类沉淀在产业里的知识、经验、工具和流程,都将成为可以被智能体承接和放大的能力。




