多语言神经语音合成工具SpeakItAI：结合Azure与Gradio的创新应用

SpeakItAI是一款结合了Microsoft Azure神经语音合成服务和Gradio简洁Web界面的开源文本转语音（TTS）应用，提供多语言支持、个性化语音输出和多种输入方式，适用于全球用户。

3 个月前1 小时前34创意工具文本转语音多语言支持个性化语音Azure服务

SpeakItAI简介

SpeakItAI是一款开源的文本转语音（TTS）应用，它巧妙地融合了Microsoft Azure的先进神经语音合成服务与Gradio的直观Web界面，致力于为用户提供自然流畅的语音输出体验。

SpeakItAI：基于Azure与Gradio的多语言神经语音合成工具

核心功能

多语言支持：覆盖140多种语言和方言，包括英式英语、美式英语、法语、德语、俄语、中文、西班牙语、印地语等，满足全球用户需求。
语音参数调节：用户可以自定义语音风格、语速和音调，实现个性化的语音输出。
多种输入方式：支持直接在文本框输入文本或上传.txt文件，使用灵活。
音频输出：生成的语音以.wav格式输出，可在浏览器中直接播放。
智能界面设计：下拉菜单自动填充默认语言、语音和风格，界面显示人类可读的语言名称，提升用户友好性。
模块化架构：采用模块化设计，便于未来功能扩展和维护。

免费使用Azure神经语音合成

Microsoft Azure提供免费的神经语音合成服务，每月可免费转换50万字符，适用于F0（免费）定价层。

按字符计费：超出免费额度后，按字符计费，费用透明。
每月重置：免费额度每月自动重置，无需手动操作。
无需信用卡：注册使用免费服务时，无需提供信用卡信息，降低试用门槛。

快速开始指南

克隆项目仓库：https://github.com/loglux/SpeakItAI
创建Azure语音资源：在Azure门户中创建语音资源（建议选择F0免费层），获取密钥和区域信息。
配置环境变量：复制.env.example文件为.env，并填入Azure的密钥和区域信息。
安装依赖：建议使用虚拟环境，安装所需的Python依赖包。
运行应用：执行python app.py启动应用，即可在浏览器中访问界面，开始使用。

使用注意事项

若同时提供文本框输入和文件上传，系统优先处理上传的文件。
仅支持上传.txt格式的文件，确保文件格式正确。
输出的音频文件为.wav格式，可直接在浏览器中播放。
若选择的语音不支持特定风格，系统将自动使用默认风格。

SpeakItAI的设计旨在为用户提供高质量、个性化的语音合成体验，适用于内容创作、教育培训、无障碍访问等多种场景。

SpeakItAI：基于Azure与Gradio的多语言神经语音合成工具

SpeakItAI项目地址

GitHub：https://github.com/loglux/SpeakItAI