之前我介绍如何使用ChatTTS来文字转声音,
ChatTTs炸翻圈线上即可用——AI不仅可以人美还能声甜,中英混合也说得溜
最近有大佬在这个基础上开源了升级版本,
增强版ChatTTS:
https://github.com/panyanyany/Awesome-ChatTTS?tab=readme-ov-file
无论是在线使用还是布署,
增强的版本都更简单方便,
支持长文本的自动切割合并,
还支持小说类型的多角色对话,
字节Seed-TTs炸裂登场——完美的声波艺术,彻底颠覆喜马拉雅等有声读物圈
这是和SeedTTS杠上了,
但ChatTTS是开源能用的,Seed是闭源的。
看看我刚刚做的多角色短篇有声故事:
内容主题是:
周瑜和鲁迅先生跨越时空的对话
脚本支持自定义,
角色数量和音色也是自定义,
包括角色的口语化,语速和停顿等等,
可操作性很高。
增强版本的效果更逼真自然,
已经有人抓到先机赚到第一桶金了,
有某宝卖安装教程卖课的;
有卖API的;
有卖套壳的软件的,
在线试用的地址如下:
https://huggingface.co/spaces/lenML/ChatTTS-Forge
升级版本还添加了几十种说话的风格情绪:
放松的聊天情绪:
吵架生气情绪:
回顾尴尬经历:
害怕恐惧的情绪:
其他情绪的合集:
另外增强版本的音色也丰富多样,
有大佬把所有随机音色都试了一遍,
大家可以直接在这个地址上试听:
https://github.com/kangyiwen/TTSlist/
这样省去大家一个个去试音色的时间。
此外长文本的实现也增强了,
模型能够自动完成切分和合并,
参数调节多样化,
包括语速和口语化的自定义。
最近关于TTS的进展特别多,
文字转语音完成了跨越式的进步,
以后配合Sora类的优质视频平台,
可以说再也无法分清虚拟和现实了。
谢谢阅读,点赞是我创作动力~
作者:LLM榴莲猫