轻量级开源文本转语音模型Parler TTS详解
本文介绍了开源的Parler TTS文本转语音模型,它能够生成高质量、自然流畅的语音,并提供在线体验和GitHub项目链接。
Parler TTS是什么
Parler TTS是一款轻量级的开源文本转语音模型,它能够根据指定的说话者风格(如性别、音调、说话风格等)生成高质量的语音。该模型基于Dan Lyth和Simon King在Stability AI和爱丁堡大学发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》进行复现,与其他TTS模型相比,Parler TTS是完全开源的,所有数据集、预处理、训练代码和权重都通过宽松的许可证公开发布,供感兴趣的用户在线体验。
Parler TTS模型图片

开源高质量文本转语音 (TTS) 模型
演示地址:Parler TTS在线演示
GitHub:Parler TTS项目源码