开发了一个免费在线文字合成语音网站

2024-03-23 10:36#1 标记1

视频翻译配音pyVideoTrans是一个开源的AI工具，用于将视频从一种语言翻译为另一种语言，同时生成该语言的字幕和配音。
开源地址 https://github.com/jianchang512/pyvideotrans
视频翻译配音软件也支持单独使用 “文字合成语音” 功能，可将文字使用 edgeTTS openaiTTS GPT-SOVITS 等合成语音，并且支持批量处理、调整语速、对齐字幕等。

但有时仅仅想合成一段文字，使用该软件可能显得有点庞大，在没有安装该软件的电脑上，也不方便使用，单独下载的话体积将近2G，比较耗时，因此专门开发了一个简单免费无限制的“在线文字合成语音”网站，使用edgeTTS将文字合成语音。( https://tts.pyvideotrans.com )

在线合成语音的实现原理
根据输入文字和选项，组装 ssml 格式数据，然后创建websocket连接edge TTS服务器，得到返回音频数据后，合并创建mp3下载到本地。
<speak version='1.0' xmlns='http://www.w3.org/2001/10/synthesis' xml:lang='en-US'> <voice name='Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoNeural)'> <prosody pitch='-50Hz' rate='+0%' volume='+0%'> 你好啊朋友 </prosody> </voice> </speak>
主要功能特点有
免费使用，无任何限制
可在手机浏览器中使用

在线输入文字后合成语音
从本地上传txt文件，将文件内的文字合成语音
从本地上传srt字幕文件，将字幕文字合成语音
支持汉语英语等几十种语言的数百种配音角色，并且可以调节语速和语调。
合成完毕后会自动下载mp3到本地
使用方法
左侧文本框中输入要合成的文字，或者点击右下角选择从本地上传txt文件或srt字幕文件。

然后选择配音角色，配音角色的前4个字符代表语言和地区，比如“zh-CN”代表中文中国大陆。

再设置速度变化百分百，+0%代表正常速度，大于0的值代表加速，负值代表减速。

音调可选加减多少Hz，这个音调一变，效果相当于换了个人，简章是改变音色，可以尝试不同加减值体验。
最后点击立即启动合成，完成后会以mp3格式自动下载到本地
功能不足之处
受限于服务器资源，与视频翻译配音软件中的文字合成语音功能相比不足之处
不能批量多个文件合成，需要合成完一个文件后，再继续合成另一个，这个后续或许会增加支持，搞成队列一个个来
srt 字幕文件不可按照字幕时间戳来合成，而是直接去掉时间戳按照一行一行来合成
仅可实现 edgeTTS 合成，不可以使用其他TTS引擎，比如openai的tts-1模型
不能和字幕对齐，在上传srt字幕后会直接删掉字幕的时间戳行
如果需要这些功能，建议还是下载视频翻译配音软件
体验地址 https://tts.pyvideotrans.com