大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

连发两款万亿参数模型,蚂蚁百灵大模型开启2.0版

TMT星球 2025-10-09

10月9日,蚂蚁集团发布万亿参数的通用语言模型 Ling-1T。

Ling-1T是蚂蚁百灵大模型Ling 2.0 系列的第一款旗舰模型,也是蚂蚁百灵团队迄今为止推出的规模最大、能力最强的非思考大模型。

测评显示,在有限输出 Token 条件下,Ling-1T于多项复杂推理基准中取得 SOTA 表现,展示出在高效思考与精确推理之间的卓越平衡。在代码生成、软件开发、竞赛数学、专业数学、逻辑推理等多项高难度基准测试上,Ling-1T 均取得领先成绩,多项指标位居开源模型的榜首。

以竞赛数学榜单 AIME 25 (American Invitation Math Examination 25)为例,Ling-1T以平均4000+ Token的消耗达到了70.42%的准确率,优于Gemini-2.5-Pro(平均5000+ Token,准确率70.10%)。Ling-1T用更少的Token实现了更高的准确率,展现出在推理精度和思考效率综合能力上的优势。

据蚂蚁百灵团队透露,Ling-1T 沿用 Ling 2.0 架构,在 20T+ tokens 高质量、高推理浓度的语料上完成预训练,支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)极大提升模型高效思考和精准推理能力。

Ling-1T 全程采用 FP8 混合精度训练(部分技术已开源),是目前已知规模最大的使用 FP8 训练的基座模型。这一设计为训练带来了显著的显存节省、更灵活的并行切分策略和 15%+ 的端到端加速。

在强化学习阶段,蚂蚁百灵团队创新性地提出了LPO方法(Linguistics-Unit Policy Optimization,LingPO) ,这是一种以“句子”为粒度的策略优化算法,为万亿参数模型的稳定训练提供了关键支持。这种方法既避免了词元级别的破碎感,也克服了序列级别的笼统性,使得奖励信号与模型行为在语义层面实现了更精准的对齐。

蚂蚁百灵团队提出了“语法-功能-美学”的混合奖励机制,在确保代码正确、功能完善的同时持续提升这个万亿基座对视觉美学的认知。在 ArtifactsBench 前端能力基准上,Ling-1T 得分59.31,在可视化和前端开发任务领域,仅次于Gemini-2.5-Pro-lowthink的得分60.28。并以显著优势位居开源模型榜首。

据「TMT星球」了解,除了Ling-1T这款非思考模型,蚂蚁百灵团队还在训练万亿参数级的深度思考大模型Ring-1T,已在9月30日开源了preview版。目前,开发者通过Hugging Face和蚂蚁百宝箱等平台都可以体验Ling-1T模型。

领跑安全行业!360获IDC大模型安全评估平台厂商技术评估认证
近日,全球领先的IT市场研究和咨询公司IDC发布《中国大模型安全评估平台厂商技术评估,2025》报告,对中国市场中主要大模型安全评估技术提供商进行能力评估。360数字安全集团凭借360大模型安全卫士领先的技术能力和实战水平,在模型安全、内容安全、智能化统

2025-10-20

超4.1万商家直播销售额同比增500%,抖音电商双11商家稳健经营
“双11”促销活动持续升温,抖音电商发布的阶段性数据显示,10月9日至10月19日,平台商家迎来生意新增长,货架与内容双场景协同发力,带动消费热度持续攀升。数据显示,超4.1万商家通过直播带动销售额同比增长500% ,搜索带动销售额破千万元的商家数量同比增

2025-10-20

「动感地带有为青年公开课」的背后:不止于懂潮流,动感地带更懂青年
文|智能相对论作者|陈选滨今天,品牌年轻化是很多企业致力于达成的发展新目标,同时我们在市场上也见证了无数企业为此使出浑身解数,但结果却总是陷入了一种自嗨型的营销困境,要么是精心设计的品牌内容被年轻人直指“爹味”太浓,要么是推出的潮流产品在年轻

2025-10-20

智谱AI回应“部门解散”:核心部门未受影响,仅涉十余人变动
近日,针对近期流传的“部门解散”“大规模裁员”等说法,智谱AI明确表示,目前公司涉及产品和研发相关部门运转正常,组织调整涉及人员十余人。这场争议始于9月底,有消息称智谱AI商业化部门旗下产研中心遭遇“整体解散”,涉及员工规模近百人,部分员工当天

2025-10-20

​荣耀Magic8系列的炸裂开新局,背后是在重构“技术护城河”
同是骁龙大有不同,荣耀AI性能释放的终极答案

2025-10-18

文心4.5衍生模型PaddleOCR-VL登顶HF Trending全球榜首
10月17日消息,HuggingFace官网显示,百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending全球第一。据了解,该模型核心参数仅0.9B,轻量高效,能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素

2025-10-17