voice-clone
声音复刻技能,使用 AI Artist API 进行音色克隆和语音合成。支持查询已有音色、上传音频创建新音色、使用指定音色合成语音。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 触发场景: - 用户要求生成语音,如"用蔡总的音色说..."、"生成一段语音"、"语音合成"等。 - 用户要求克隆音色,如"上传音频创建音色"、"复刻这个声音"、"创建我的音色"等。 - 用户查询已有音色,如"有哪些音色"、"列出音色"、"查看音色列表"等。 - 用户指定音色名称或 ID 进行语音合成。 - 用户发送语音消息后要求用该声音合成其他内容。
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/2393970875/deepsop-voice-cloneVoice Clone - 声音复刻技能
使用 AI Artist API 进行音色克隆和语音合成的完整解决方案。基于 CosyVoice v3.5 Plus 模型,支持高质量的音色复刻和文本转语音。
🎯 技能概述
本技能提供三大核心功能:
| 功能 | 说明 | 典型场景 |
|---|---|---|
| 查询音色 | 列出系统中所有可用音色 | 查看已有音色库,选择合适的声音 |
| 音色克隆 | 上传音频创建新的音色 | 复刻自己的声音、领导的声音、明星声音等 |
| 语音合成 | 使用指定音色生成语音 | 用特定声音朗读文本、生成配音、制作语音消息 |
⚠️ 首次使用必读
1. 获取 API Key
访问 https://ai.deepsop.com/ 注册并登录,然后在控制台创建你的 API Key。
2. 设置环境变量
在使用前,你必须先设置自己的 API Key:
# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"
# Linux/macOS/Git Bash (Windows)
export AI_ARTIST_TOKEN="sk-your_api_key_here"
3. 验证配置
python scripts/voice_clone.py --list
如果看到音色列表,说明配置成功!
🚀 快速开始
基础用法
# 1. 列出所有可用音色
python scripts/voice_clone.py --list
# 2. 使用音色 ID 合成语音
python scripts/voice_clone.py --synthesize --id 10 --text "大家好,我是测试语音"
# 3. 使用音色名称合成语音
python scripts/voice_clone.py --synthesize --name "蔡总的音色" --text "你好世界"
# 4. 下载合成的音频到本地
python scripts/voice_clone.py --synthesize --id 10 --text "你好" --download
创建新音色
# 使用本地音频文件创建音色
python scripts/voice_clone.py --create --name "我的音色" --audio "./my_voice.mp3"
# 使用在线音频 URL 创建音色
python scripts/voice_clone.py --create --name "我的音色" --audio-url "https://example.com/voice.mp3"
# 指定音色前缀
python scripts/voice_clone.py --create --name "客服音色" --audio "./cs.mp3" --prefix "CustomerService"
📋 详细使用指南
一、查询可用音色
列出系统中所有音色及其状态:
python scripts/voice_clone.py --list
输出示例:
[INFO] 共有 4 个音色
可用音色列表:
[13] 王俏的音色 [OK] - cosyvoice-v3.5-plus
[12] 测试 11 [OK] - cosyvoice-v3.5-plus
[10] 蔡总的音色 [OK] - cosyvoice-v3.5-plus
[4] 测试音色 [OK] - cosyvoice-v3.5-plus
状态说明:
| 状态 | 说明 | 是否可用 |
|---|---|---|
OK | 音色已就绪 | ✅ 可用 |
DEPLOYING | 音色部署中 | ❌ 暂不可用 |
| 其他 | 音色异常 | ❌ 不可用 |
二、语音合成
方式 1:使用音色 ID
python scripts/voice_clone.py --synthesize --id 13 --text "真正重要的东西,用眼睛是看不见的,只有用心才能看清。"
方式 2:使用音色名称
python scripts/voice_clone.py --synthesize --name "王俏的音色" --text "你好,欢迎使用库阔 AI"
方式 3:合成并下载
# 下载到默认目录 (~/.openclaw/workspace/audio/)
python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download
# 下载到指定目录
python scripts/voice_clone.py --synthesize --id 13 --text "测试语音" --download --output-dir "./my_audio"
三、创建新音色
从本地音频文件创建
# 支持 MP3、WAV 等常见格式
python scripts/voice_clone.py --create --name "我的声音" --audio "./my_voice.mp3"
# 使用完整路径
python scripts/voice_clone.py --create --name "领导音色" --audio "C:\Users\admin\Downloads\leader_voice.wav"
从在线 URL 创建
python scripts/voice_clone.py --create --name "网络音色" --audio-url "https://example.com/voice.mp3"
指定音色前缀
python scripts/voice_clone.py --create --name "客服小王" --audio "./wang.mp3" --prefix "CustomerService"
🎙️ 音色克隆最佳实践
音频素材要求
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-2393970875-deepsop-voice-clone": {
"enabled": true,
"auto_update": true
}
}
}Related Skills
ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:DeepSop系列图片模型(S4.5、S5.0L、N1、N2系列、W2.7系列等,共11个模型)。 支持视频模型:DeepSop系列视频模型(S1.5Pro、Sora2系列、Veo3.1系列、Wan2.6/Wan2.7系列、Kling V3 Omni等,共15个模型)。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定具体模型(详见下方模型列表)。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:**3.1Nano2-Evo(默认)**、S5.0L、N2、W2.7、W2.7Pro、Nano2-Beta-Evo。 支持视频模型:**V3.1FB(默认)**、S1.5Pro、V3.1PB、V3.1Fast、W2.6t / W2.6i / W2.6r、klingV3Omni、W2.7t / W2.7i / W2.7r。 查看当前服务端激活的模型请运行:`python3 scripts/generate_image.py --list-models`。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定模型:N2、S5.0L、W2.7、W2.7Pro、3.1Nano2-Evo、Nano2-Beta-Evo、S1.5Pro、V3.1FB、V3.1PB、V3.1Fast、W2.6t、W2.6i、W2.6r、klingV3Omni、W2.7t、W2.7i、W2.7r。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:DeepSop系列图片模型(S4.5、S5.0L、N1、N2系列、W2.7系列等,共11个模型)。 支持视频模型:DeepSop系列视频模型(S1.5Pro、Sora2系列、Veo3.1系列、Wan2.6/Wan2.7系列、Kling V3 Omni等,共15个模型)。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定具体模型(详见下方模型列表)。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
human-ai-collab
人机协作台技能。用户输入自然语言销售指令,AI自动分析拆解任务参数,调用 KocGo 平台接口提交任务,等待后查询 AiWa 挖掘客户数据,生成 xlsx 文件并返回。触发场景:用户说「帮我找客户」「挖掘XXX行业客户」「找XXX个客户」「提交任务」等与客户挖掘、销售任务相关的指令。需要提前配置环境变量 KOCGO_API_KEY。