基于阿里云 DashScope CosyVoice API 的声音助手 Web 应用,支持声音设计、声音复刻和语音合成。
- 声音设计 — 用文字描述创建自定义音色(如"温柔女声"、"低沉男声")
- 声音复刻 — 上传音频样本或填写音频 URL,复刻指定说话人的音色
- 语音合成 — 选择已有音色,输入文本,一键生成语音
- 多音色合成 — 多段文本分别指定不同音色,合成后自动拼接为完整音频
- 音色管理 — 查看、试听、删除已创建的自定义音色
- 后端:Python / Flask
- 前端:原生 HTML + CSS + JavaScript(无框架依赖)
- AI:阿里云 DashScope CosyVoice(
cosyvoice-v3-flash/cosyvoice-v3-plus等) - 部署:支持本地运行 & Vercel 部署
pip install -r requirements.txt在环境变量中设置阿里云 DashScope API Key:
export DASHSCOPE_API_KEY=your_api_key_here也可以在页面右上角的输入框中直接填写 API Key,无需配置环境变量。
python app.py浏览器打开 http://127.0.0.1:5001
| 接口 | 方法 | 说明 |
|---|---|---|
/api/design |
POST | 声音设计,通过文字描述创建音色 |
/api/clone |
POST | 声音复刻,通过音频 URL 或文件复刻音色 |
/api/list |
POST | 列出已创建的音色 |
/api/delete |
POST | 删除指定音色 |
/api/synth |
POST | 单音色语音合成 |
/api/synth_multi |
POST | 多音色语音合成 |
所有接口支持通过请求头 X-Api-Key 传入 API Key,优先级高于服务器环境变量。
项目已包含 vercel.json,直接推送到 GitHub 后在 Vercel 导入即可。
记得在 Vercel 项目设置中添加环境变量:
DASHSCOPE_API_KEY=your_api_key_here