大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

豆包大模型2.0发布,推理能力达到世界顶尖水平

TMT星球 2026-02-24

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后,2月14日,字节跳动宣布推出豆包大模型2.0(Doubao-Seed-2.0)系列。豆包2.0针对大规模生产环境的使用需求进行系统性优化,旨在更好地完成真实世界的复杂任务。

在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,也超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平。

大模型执行长链路复杂任务,需要丰富的世界知识。豆包2.0加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列。

在教育、娱乐、办公等众多场景中,大模型需要理解图表、复杂文档、视频等内容。对此,豆包2.0全面升级多模态理解能力,视觉推理、空间感知、长上下文理解等权威测试均取得业界最佳表现。

面对动态场景,豆包2.0增强了对时间序列与运动感知的理解能力,还可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景。

Agent能力是大模型具备行动力的关键。测试成绩显示,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平,在HLE-Text(人类的最后考试)上更是获得54.2的最高分,大幅领先于其他模型。

目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择「专家」模式即可对话体验。火山引擎也已上线豆包2.0系列模型API服务。

据「TMT星球」了解,豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势。豆包2.0 Lite更是极具性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元。

首个国产企业级满血版OpenClaw来了!百度DuMate全量上线
3月22日,百度DuMate正式上线,面向用户全量开放。这是国内首个国产企业级龙虾产品,支持本地部署,企业级用户也能安全合规使用。针对目前龙虾的安全风险痛点,DuMate提供了完善的解决方案,实现多重防护。一方面,DuMate通过预装安全沙箱,实现与本机设备环

2026-03-23

追觅矿山投产年产黄金超1吨 地象几何用AI挖金
作者 / 江泓 出品 / 网界2026年AWE家电展,本该是智能家居、消费电子的主场,却被一条矿业消息抢尽风头。追觅科技生态企业地象几何(全称“地象几何科技(成都)有限公司”)官宣巴基斯坦自有金矿全面投产,据测算年产黄金将超1吨,年产值稳稳突破10亿元。很

2026-03-23

阿里千问上线打车能力:一句话搞定叫车、选车、预约
3月23日,阿里巴巴旗下大模型产品“千问”宣布上线打车能力。与传统打车App不同,千问将“对话式出行”真正落地,用户只需一句话,就能完成从选车型、设途经点到预约时间的全流程操作,出行体验进一步被重构。从功能上看,这次升级的核心在于“自然语言直达结

2026-03-23

OpenClaw创始人确认 360独家发现安全漏洞
近日,360安全云团队收到OpenClaw创始人Peter的官方回信,邮件中Peter确认,由360团队独家发现的OpenClaw Gateway WebSocket无认证升级漏洞属实,该漏洞为高危零日(0Day)漏洞,存在极大安全隐患。据了解,该零日漏洞可被攻击者利用WebSocket通道静默绕过权限

2026-03-23

单日10万人打卡!追觅AWE2026亮点扎堆,生态3.0揭秘
2026年3月15日,为期四天的AWE 2026(上海新国际博览中心的中国家电及消费电子博览会)落下帷幕,作为亚洲极具影响力的消费电子行业盛会,AWE一直是全球科技企业展示创新成果、与用户深度交流的核心平台。而本届展会中,以“追觅宇宙ALL IN DREAME”为主题独家

2026-03-20