连发两款万亿参数模型，蚂蚁百灵大模型开启2.0版-大旗号

10月9日，蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。

Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型，也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示，在有限输出 Token 条件下，Ling-1T于多项复杂推理基准中取得 SOTA 表现，展示出在高效思考与精确推理之间的卓越平衡。在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上，Ling-1T 均取得领先成绩，多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 （American Invitation Math Examination 25）为例，Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率，优于Gemini-2.5-Pro(平均5000+ Token，准确率70.10%）。Ling-1T用更少的Token实现了更高的准确率，展现出在推理精度和思考效率综合能力上的优势。

据蚂蚁百灵团队透露，Ling-1T 沿用 Ling 2.0 架构，在 20T+ tokens 高质量、高推理浓度的语料上完成预训练，支持最高 128K 上下文窗口，通过“中训练+后训练”的演进式思维链（Evo-CoT）极大提升模型高效思考和精准推理能力。

Ling-1T 全程采用 FP8 混合精度训练（部分技术已开源），是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段，蚂蚁百灵团队创新性地提出了LPO方法(Linguistics-Unit Policy Optimization，LingPO) ，这是一种以“句子”为粒度的策略优化算法，为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感，也克服了序列级别的笼统性，使得奖励信号与模型行为在语义层面实现了更精准的对齐。

蚂蚁百灵团队提出了“语法-功能-美学”的混合奖励机制，在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上，Ling-1T 得分59.31，在可视化和前端开发任务领域，仅次于Gemini-2.5-Pro-lowthink的得分60.28。并以显著优势位居开源模型榜首。

据「TMT星球」了解，除了Ling-1T这款非思考模型，蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T，已在9月30日开源了preview版。目前，开发者通过Hugging Face和蚂蚁百宝箱等平台都可以体验Ling-1T模型。

百度重组AI，成立数字人创新业务部

近日，据媒体报道，百度MEG业务板块迎来新一轮组织架构调整。本次调整将商业部与电商事业部合并，组建大商业事业部，同时原数字人创新业务部升级为独立部门。早在5月13日举办的Create2026百度AI开发者大会上，百度就对数字人业务进行重点布局。旗下数字人品牌

2026-06-08

AI玩具权威科普：2026年品牌、性价比与选购全指南
2026-06-07

俞浩梦想奖学金升级，设立本科四年持续助学机制
2026-06-07

“你打你的，我打我的”，华为云在国计民生里找到了真正的牌桌

在国计民生这条路上，AI如何跑得更远？华为云给出了答案

2026-06-06

他用WPS笔记，把AI报错变成了可复用的“避坑指南”
2026-06-05

登顶全球！追觅扫地机斩获全球销量销额双第一

6 月 4 日，国际数据公司 IDC 正式发布《全球家用智能扫地机器人市场季度跟踪报告》，2026 年第一季度，追觅扫地机强势拿下全球销量与销额双第一。自诞生之初，追觅扫地机便锚定“生而全球化”的战略，自 2023 年 5 月至今，追觅扫地机已在全球 120 个国家和

2026-06-05

宇树、智元的线下门店叙事：具身智能正迈进商业周期

新的起点

2026-06-05

杭州家装深度解码：跳出“哪家好”的陷阱，建立你的价值坐标系

2026年，杭州家装市场正经历一场静默的范式转移。杭州市建筑装饰行业协会数据显示，本地住宅装修投诉中，“效果图与实景不符”“增项纠纷”“交付后环保不达标”三类问题占比超六成。与此同时，一项关于“新一代住宅需求”的消费者调研显示，87.3%的杭州购房

2026-06-05