大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

打造全自动AI后期链路,豆包语音团队提出“AI多人有声剧”方案

TMT星球 2025-10-28

近日,豆包语音团队发布了“AI多人有声剧”自动化方案。方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。

据「TMT星球」了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。这套方案不仅使得听书自然度、沉浸感显著提升,且生产链路全程无人工参与,可大幅降低制作成本、缩短制作周期,高效覆盖更多书籍。

“AI多人有声剧”自动化方案支持从小说文本到完整成品有声剧的全自动生产。该方案可以自动进行角色划分,准确率超过98%,同时其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人演播效果发音自然、情感丰富。

此外,方案中的画本预测模型在多角色演播音频基础上,实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,在得到画本信息之后进行音频召回并合成、智能动态调整音频参数,并结合多角色TTS最终合成“有声剧”成品。

目前,首批通过“AI多人有声剧”方案端到端创作的作品已经在番茄小说APP上线,效果超出预期,并得到书友良好反馈,为听书行业注入全新活力。未来,“AI多人有声剧”方案仍将不断升级,覆盖更多有声内容,小说更新即可让用户同步享受精品有声剧。

医疗AI的“希波克拉底誓言”:何以实现可信、可用、可落地?
医疗大模型正在加速落地。IDC最新发布的《中国医疗大模型技术评估,2026》显示,2025年医疗大模型相关项目较2024年增长2倍,成为未来两年首要投资的技术。值得关注的是,在IDC开展的第二轮医疗大模型实测中,东软添翼医疗大模型拿下场景、技术、服务三大维度

2026-06-09

百度重组AI,成立数字人创新业务部
近日,据媒体报道,百度MEG业务板块迎来新一轮组织架构调整。本次调整将商业部与电商事业部合并,组建大商业事业部,同时原数字人创新业务部升级为独立部门。早在5月13日举办的Create2026百度AI开发者大会上,百度就对数字人业务进行重点布局。旗下数字人品牌

2026-06-08

“你打你的,我打我的”,华为云在国计民生里找到了真正的牌桌
在国计民生这条路上,AI如何跑得更远?华为云给出了答案

2026-06-06

登顶全球!追觅扫地机斩获全球销量销额双第一
6 月 4 日,国际数据公司 IDC 正式发布《全球家用智能扫地机器人市场季度跟踪报告》,2026 年第一季度,追觅扫地机强势拿下全球销量与销额双第一。自诞生之初,追觅扫地机便锚定“生而全球化”的战略,自 2023 年 5 月至今,追觅扫地机已在全球 120 个国家和

2026-06-05