大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

打造全自动AI后期链路,豆包语音团队提出“AI多人有声剧”方案

TMT星球 2025-10-28

近日,豆包语音团队发布了“AI多人有声剧”自动化方案。方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。

据「TMT星球」了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。这套方案不仅使得听书自然度、沉浸感显著提升,且生产链路全程无人工参与,可大幅降低制作成本、缩短制作周期,高效覆盖更多书籍。

“AI多人有声剧”自动化方案支持从小说文本到完整成品有声剧的全自动生产。该方案可以自动进行角色划分,准确率超过98%,同时其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人演播效果发音自然、情感丰富。

此外,方案中的画本预测模型在多角色演播音频基础上,实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,在得到画本信息之后进行音频召回并合成、智能动态调整音频参数,并结合多角色TTS最终合成“有声剧”成品。

目前,首批通过“AI多人有声剧”方案端到端创作的作品已经在番茄小说APP上线,效果超出预期,并得到书友良好反馈,为听书行业注入全新活力。未来,“AI多人有声剧”方案仍将不断升级,覆盖更多有声内容,小说更新即可让用户同步享受精品有声剧。

MOVA孵化的这群音频圈老炮,如何用一张卡片撬动全球市场?
出品 | 大力财经作者| 魏力一场破圈的海外发布会“这是我首次见到,能将AI语音技术与便携录音设备结合得如此深度的产品。”—— 2025年10月23日,波兰华沙,一位当地资深科技记者在MOVA TPEAK新品发布会现场发出这样的感叹。这场发布会,让一款来自中国的、厚

2025-11-14

百度发布原生全模态大模型文心5.0 李彦宏:持续推高智能天花板
11月13日,2025百度世界大会上,百度正式对外发布原生全模态大模型文心大模型5.0。该模型参数量达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。文心5.0基础能力全面升级,在多模态理

2025-11-14

超能小度完成史上最普惠AI升级,小度让每位用户都不掉队
2025年11月13日,在百度世界大会“大模型如何重塑智能硬件新体验”分论坛上,小度科技正式发布其全新升级的多模态AI智能助手——超能小度,并宣布全系、全量、全生态上线。这不仅标志着小度完成了从AI助手向AI伙伴的关键进化,更将推动数千万台已售小度设备免

2025-11-13

百度发布多项AI重磅成果 智能不再是成本而是生产力
“当AI能力被内化,成为一种原生的能力,智能就不再是成本,而是生产力。”11月13日举办的2025百度世界大会上,百度创始人李彦宏演讲时表示,更应关心如何让AI跟每一项任务有机结合,“让AI成为企业发展和个人成长的原生推动力。”作为最早进军AI赛道的科技公

2025-11-13