ClawKit Logo
ClawKitReliability Toolkit
Back to Registry
Official Verified

海螺语音合成与设计

使用 Minimax(海螺)API 进行语音合成、声音克隆和音色设计。当用户想要语音合成、TTS、声音克隆、音色设计时使用此 skill。

skill-install — Terminal

Install via CLI (Recommended)

clawhub install openclaw/skills/skills/hexiaochun/minimax-audio
Or

海螺语音合成与设计

使用 Minimax(海螺)API 进行语音合成、声音克隆和音色设计。

功能概述

功能工具名称费用说明
获取音色列表list_voices免费获取系统音色和用户自定义音色
语音合成text_to_audio1积分/千字符将文本转换为语音
语音设计voice_design5积分/次用自然语言创建自定义音色
声音克隆voice_clone10积分/次通过音频样本克隆声音
上传音频upload_audio免费上传音频用于声音克隆

可用工具

1. list_voices - 获取音色列表

获取系统音色和用户创建的自定义音色。

参数:

  • status(可选): 音色状态过滤,可选值:active(有效)、expired(过期)、all(全部)

示例:

{
  "name": "list_voices",
  "arguments": {
    "status": "active"
  }
}

返回:

{
  "success": true,
  "user_voices": [...],      // 用户创建的音色
  "public_voices": [...],    // 系统公共音色
  "statistics": {
    "user_total_count": 5,
    "user_active_count": 3,
    "public_voices_count": 500
  }
}

2. text_to_audio - 语音合成

将文本转换为语音。

参数:

  • text(必填): 要合成的文本内容,最大 10000 字符
  • voice_id(必填): 音色 ID,可通过 list_voices 获取
  • model(可选): 模型版本,默认 speech-2.8-hd
    • speech-2.8-hd: 最新高清模型,支持语气词标签
    • speech-2.8-turbo: 最新快速模型,支持语气词标签
    • speech-2.6-hd: 高清音质,支持 fluent/whisper 情绪
    • speech-2.6-turbo: 快速模式,支持 fluent/whisper 情绪
  • output_format(可选): 输出格式,urlbase64,默认 url
  • language_boost(可选): 语言增强,可选 ChineseEnglishJapaneseKoreanauto
  • speed(可选): 语速,取值 0.5-2,默认 1.0。值越大语速越快
  • pitch(可选): 语调,取值 -12 到 12,默认 0。正值音调升高,负值音调降低
  • vol(可选): 音量,取值 0-10,默认 1.0

示例:

{
  "name": "text_to_audio",
  "arguments": {
    "text": "各位听众朋友们,大家好!今天我们来聊聊人工智能的发展。",
    "voice_id": "male-qn-qingse",
    "model": "speech-2.8-hd",
    "speed": 1.2,
    "pitch": 2
  }
}

返回:

{
  "success": true,
  "audio_url": "https://...",
  "trace_id": "xxx",
  "price": 1,
  "balance": 990.0
}

3. voice_design - 语音设计

用自然语言描述创建自定义音色,无需上传音频样本。

参数:

  • prompt(必填): 音色描述,用自然语言描述想要的声音特征
  • preview_text(可选): 试听文本,默认 "各位听众朋友们,大家好!"
  • voice_name(可选): 音色名称,方便后续识别

示例:

{
  "name": "voice_design",
  "arguments": {
    "prompt": "年轻女性,声音甜美温柔,语速适中,适合讲故事和温馨内容",
    "preview_text": "今天天气真不错,我们一起出去走走吧。",
    "voice_name": "温柔女声"
  }
}

返回:

{
  "success": true,
  "voice_id": "design_abc123_def456",
  "audio_url": "https://...",
  "voice_name": "温柔女声",
  "expires_at": "2024-01-08 12:00:00",
  "price": 5,
  "balance": 985.0,
  "message": "音色创建成功!可在 7 天内使用此音色进行语音合成"
}

4. upload_audio - 上传音频

上传音频文件到 Minimax,用于声音克隆。

参数:

  • audio_url(必填): 音频文件的 URL 地址
  • purpose(可选): 用途,默认 voice_clone
    • voice_clone: 声音克隆音频,时长 10秒-5分钟
    • prompt_audio: 示例音频,时长 <8秒

文件要求:

  • 格式: mp3, m4a, wav
  • 大小: ≤ 20MB
  • 声音克隆建议时长: 10秒-5分钟

示例:

{
  "name": "upload_audio",
  "arguments": {
    "audio_url": "https://example.com/my-voice-sample.mp3",
    "purpose": "voice_clone"
  }
}

返回:

{
  "success": true,
  "file_id": 123456,
  "filename": "audio_20240101120000.mp3",
  "bytes": 5896337,
  "purpose": "voice_clone",
  "message": "音频上传成功!可使用返回的 file_id 进行声音克隆"
}

Metadata

Stars2387
Views0
Updated2026-03-09
View Author Profile
AI Skill Finder

Not sure this is the right skill?

Describe what you want to build — we'll match you to the best skill from 16,000+ options.

Find the right skill
Add to Configuration

Paste this into your clawhub.json to enable this plugin.

{
  "plugins": {
    "official-hexiaochun-minimax-audio": {
      "enabled": true,
      "auto_update": true
    }
  }
}

Tags

#语音合成#tts#声音克隆#音色设计#minimax#海螺
Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.