小米开源全新TTS模型：多语言方言声音克隆，合成速度快至3-10秒

20 次浏览发布 2026-05-30更新 2026-07-28

小米最新开源的OmniVoice模型，支持600+语言方言，实现快速声音克隆和合成，适用于多种场景，具有高效、易用等亮点。

OmniVoice：多语言方言声音克隆与合成解决方案

小米最新开源的OmniVoice模型，是一款领先的多语言零样本文本到语音（TTS）模型，支持超过600种语言和方言。该模型基于创新的扩散语言模型架构，能够以极快的速度生成高质量的语音，并提供语音克隆和声音设计功能。

OmniVoice完全开源，可在GitHub上获取，支持本地离线运行、二次开发与商用。

特别支持以下方言：陕西话、河南话、四川话、贵州话、云南话、桂林话、济南话、石家庄话、甘肃话、宁夏话、青岛话、东北话。

OmniVoice.zip  [7.9 GB]

夸克网盘 · 免费下载

https://pan.quark.cn/s/5fe0951bc260