大旗号
科技 汽车 财经 数码 时尚 旅游 美文 美食 其它

豆包语音团队提出“AI多人有声剧”方案,效果媲美真人配音+后期

ITBEAR科技资讯 2025-10-28

近日,豆包语音团队发布了“AI多人有声剧”自动化方案。方案支持多角色、高表现力的TTS(语音合成)演播,同时实现了全自动AI后期的链路,从小说文本到高质量的多人有声剧成品,全部由AI端到端完成。

据了解,“AI多人有声剧”自动化方案基于高自然度的多角色智能朗读,配合AI后期自动添加音乐、音效、特效, 并进行智能混音,能够全自动生产媲美真人水准的有声剧作品。这套方案不仅使得听书自然度、沉浸感显著提升,且生产链路全程无人工参与,可大幅降低制作成本、缩短制作周期,高效覆盖更多书籍。


“AI多人有声剧”自动化方案支持从小说文本到完整成品有声剧的全自动生产。该方案可以自动进行角色划分,准确率超过98%,同时其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人演播效果发音自然、情感丰富。

此外,方案中的画本预测模型在多角色演播音频基础上,实现了从小说文本到带有音效、人声特效、环境音、配乐的画本预测,在得到画本信息之后进行音频召回并合成、智能动态调整音频参数,并结合多角色TTS最终合成“有声剧”成品。

目前,首批通过“AI多人有声剧”方案端到端创作的作品已经在番茄小说APP上线,效果超出预期,并得到书友良好反馈,为听书行业注入全新活力。未来,“AI多人有声剧”方案仍将不断升级,覆盖更多有声内容,小说更新即可让用户同步享受精品有声剧。

从首发4nm智驾芯片到兜底城市领航安全,比亚迪开启AI新征程
在AI技术的驱动下,汽车正在从单纯的出行工具加速进化为能主动思考的智能生命体。但对于普通消费者而言,即便是拥有带智驾功能的车辆,仍有约70%的用户不常用、甚至不敢用。为了让好技术人人可享、人人放心享,日前,比亚迪率先承诺为城市领航安全兜底1年。也

2026-06-01

中端机卷到极致,vivo S60 另起一局
vivo S60 重新读懂年轻人

2026-05-30

交大医学院携手华为:解锁光智共融,AI F5G-A如何重塑数智校园?
周浦镇位于上海市浦东新区西部、黄浦江东岸,既有“浦东第一镇”“小上海”的美誉,也是被称为“医谷”的上海国际医学园区所在地。2025年9月,上海交通大学医学院(以下称“交大医学院”)浦东校区的正式启用,不仅为“医谷”补上了医学教育的关键拼图,更开

2026-05-29

Agent还没来,昇腾已经把从硬件到软件的路铺好了
昇腾,打响了一场Agent前夜的“硬软合围战”

2026-05-29

网媒发稿为什么应该选择JHMS媒体传讯服务?三次踩坑实录与避坑指南
网媒发稿,又称网络媒体发稿,是企业/组织/个人将新闻、资讯、软文等内容送达至网络媒体方审核以期获得刊载传播的行为。和传统纸媒发稿相比,网媒发稿的传播速度更快、覆盖范围更广,是现在主流的品牌传播、公关宣传方式。网媒发稿实现形式总体可以分“自行联

2026-05-29