近日,豆包语音团队发布了“AI多人有声剧”自动化方案。方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。
据「TMT星球」了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。这套方案不仅使得听书自然度、沉浸感显著提升,且生产链路全程无人工参与,可大幅降低制作成本、缩短制作周期,高效覆盖更多书籍。

“AI多人有声剧”自动化方案支持从小说文本到完整成品有声剧的全自动生产。该方案可以自动进行角色划分,准确率超过98%,同时其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人演播效果发音自然、情感丰富。
此外,方案中的画本预测模型在多角色演播音频基础上,实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,在得到画本信息之后进行音频召回并合成、智能动态调整音频参数,并结合多角色TTS最终合成“有声剧”成品。
目前,首批通过“AI多人有声剧”方案端到端创作的作品已经在番茄小说APP上线,效果超出预期,并得到书友良好反馈,为听书行业注入全新活力。未来,“AI多人有声剧”方案仍将不断升级,覆盖更多有声内容,小说更新即可让用户同步享受精品有声剧。
豆包内测已接入抖音电商,无需跳转即可下单
3月30日,据《科创板日报》消息,字节跳动旗下AI助手豆包已接入抖音电商,支持在豆包APP内直接下单并完成支付,无需跳转抖音,该功能目前处于内测阶段。据悉,豆包APP于3月19日更新隐私政策,明确“购物功能”由合作电商平台上海格物致品网络科技有限公司及其
2026-03-31
蚂蚁灵波开源2.71T深度数据集,填补真实场景空间感知数据空白
蚂蚁灵波开源2.7T深度数据集,200万对真实样本,覆盖6款相机3 月 31 日,蚂蚁灵波科技正式开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。该数据集包含 300 万对高质量样本,其中 200 万对来自真实场景采集、100 万对由渲染生成,总规模达 2.71TB,覆盖
2026-03-31
神州数码2025年度财报:AI转型提速,营收再创新高
3月30日晚间,神州数码(000034.SZ)发布2025年度全年业绩。报告期内,神州数码紧抓AI技术产业落地加速的新机遇,坚定聚焦AI for Process,全年营收实现1437.5亿元,逆势增长12.2%,经营规模再创新高。其中,AI多元布局加速落地,AI相关业务收入实现330.3亿元
2026-03-30
乐聚建成国内首条年产能万台级人形机器人产线
3月29日,国内首条年产能万台级的人形机器人自动化产线在广东正式投入使用,人形机器人规模化量产能力取得重大突破。该产线年产能突破一万台,可实现每30分钟下线一台人形机器人,高效满足市场规模化交付需求。产线上24道精密组装工序均实现数字化,效率较传
2026-03-30
学生高端读写大路灯哪个好?独语vsVIIS睿光vs米家护眼实测
科技不冗余,独语C2打造学生专属护眼体验学生高端读写大路灯哪个好?高端学生读写大路灯,不应只靠科技噱头和品牌溢价,更要靠硬核参数和实用设计说话。市面上不少高端机型,堆砌冗余功能、价格虚高,难以真正适配学生读写需求,反而增加使用成本。学生高端读
2026-03-30