大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

豆包大模型1.6创新“区间定价”,客户使用成本降至三分之一

ITBEAR科技资讯 2025-06-11

6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。

字节跳动CEO梁汝波表示:“字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。”

豆包大模型全线迈入全球第一梯队

会上,豆包1.6模型披露多项权威测评成绩。在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。

据火山引擎总裁谭待介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。此前,豆包1.5的多模态能力在60个公开评测基准中取得38项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。图形界面操作能力则让豆包1.6进一步具备“行动力”。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。

图:火山引擎总裁谭待

豆包视频生成模型Seedance 1.0 pro也在火山引擎Force大会亮相。该模型支持文字与图片输入,可生成多镜头无缝切换的1080P高品质视频,主体运动稳定性与画面自然度较高。

在国际知名评测榜单 Artificial Analysis 上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等优秀模型。

目前,豆包大模型已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、8成主流汽车品牌、70%的系统重要性银行及超5成985高校。

数据显示,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长137倍。另据IDC报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达46.4%。

Agent规模化应用提速

谭待表示,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。

通过技术和商业的双重创新,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0-32K输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。

为了更好地支持Agent开发与应用,火山引擎AI云原生全栈服务升级,发布了火山引擎MCP服务、promptPilot 智能提示工具、AI知识管理系统、veRL强化学习框架等产品,并推出多模态数据湖、AICC私密计算、大模型应用防火墙,以及一系列AI Infra套件。

图:字节跳动技术副总裁洪定坤

字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的 Agent 和工具,让软件开发“all in one”,更大幅度地降低开发门槛,提升开发效率。洪定坤表示,豆包1.6模型在编程能力上进步很大,已经接入字节的AI编程产品TRAE内测,新模型将很快推送给用户。

据洪定坤透露,在字节内部,超过80%的工程师在使用TRAE辅助开发。TRAE 的整体月活用户已经超过了 100 万。

谭待认为,技术主体经历了三个时代变化,AI时代会推动开发范式与技术架构全面升级。他说:“PC时代主体是Web,移动时代是APP,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务。从被动工具转变为主动执行者。豆包大模型和AI云原生将持续迭代,助力企业构建和大规模应用Agent。”


豆包内测已接入抖音电商,无需跳转即可下单
3月30日,据《科创板日报》消息,字节跳动旗下AI助手豆包已接入抖音电商,支持在豆包APP内直接下单并完成支付,无需跳转抖音,该功能目前处于内测阶段。据悉,豆包APP于3月19日更新隐私政策,明确“购物功能”由合作电商平台上海格物致品网络科技有限公司及其

2026-03-31

高德全量开源ABot-M0:全球首个统一架构的具身操作基座模型
近日,高德宣布正式全量开源ABot-M0——全球首个基于统一架构的机器人具身操作基座模型,可实现一个“通用大脑”适配多种形态的具身机器人。

2026-03-31

蚂蚁灵波开源2.71T深度数据集,填补真实场景空间感知数据空白
蚂蚁灵波开源2.7T深度数据集,200万对真实样本,覆盖6款相机3 月 31 日,蚂蚁灵波科技正式开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。该数据集包含 300 万对高质量样本,其中 200 万对来自真实场景采集、100 万对由渲染生成,总规模达 2.71TB,覆盖

2026-03-31

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro
3月30日,阿里发布千问新一代全模态大模型Qwen3.5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3.1 Pro,成为目前全球最强的全模态大模型之一。新模型拥有极强的音视频理解与实时交互能力,能够对音视频内容生成详细且可控

2026-03-31