Skip to content

aliang2052/aliangCosyVoice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

aliangCosyVoice

基于阿里云 DashScope CosyVoice API 的声音助手 Web 应用,支持声音设计、声音复刻和语音合成。

功能

  • 声音设计 — 用文字描述创建自定义音色(如"温柔女声"、"低沉男声")
  • 声音复刻 — 上传音频样本或填写音频 URL,复刻指定说话人的音色
  • 语音合成 — 选择已有音色,输入文本,一键生成语音
  • 多音色合成 — 多段文本分别指定不同音色,合成后自动拼接为完整音频
  • 音色管理 — 查看、试听、删除已创建的自定义音色

技术栈

  • 后端:Python / Flask
  • 前端:原生 HTML + CSS + JavaScript(无框架依赖)
  • AI:阿里云 DashScope CosyVoice(cosyvoice-v3-flash / cosyvoice-v3-plus 等)
  • 部署:支持本地运行 & Vercel 部署

快速开始

1. 安装依赖

pip install -r requirements.txt

2. 配置 API Key

在环境变量中设置阿里云 DashScope API Key:

export DASHSCOPE_API_KEY=your_api_key_here

也可以在页面右上角的输入框中直接填写 API Key,无需配置环境变量。

3. 启动服务

python app.py

浏览器打开 http://127.0.0.1:5001

API 接口

接口 方法 说明
/api/design POST 声音设计,通过文字描述创建音色
/api/clone POST 声音复刻,通过音频 URL 或文件复刻音色
/api/list POST 列出已创建的音色
/api/delete POST 删除指定音色
/api/synth POST 单音色语音合成
/api/synth_multi POST 多音色语音合成

所有接口支持通过请求头 X-Api-Key 传入 API Key,优先级高于服务器环境变量。

部署到 Vercel

项目已包含 vercel.json,直接推送到 GitHub 后在 Vercel 导入即可。

记得在 Vercel 项目设置中添加环境变量:

DASHSCOPE_API_KEY=your_api_key_here

相关链接

About

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors