ClawKit Logo
ClawKitReliability Toolkit
Back to Registry
Official Verified

mimo-tts-asr

Xiaomi MiMo V2.5 TTS + ASR 全能语音技能。支持高质量中英文语音合成(TTS)和语音识别(ASR)。 TTS: 三款模型(精品音色 / VoiceDesign 音色设计 / VoiceClone 音色克隆)、方言支持、情感控制、多格式输出。 ASR: 音频转文字、多语言识别、方言、Code-Switch、强噪音场景。支持 API 调用和开源模型本地部署。 触发词: 语音合成 / 文字转语音 / TTS / 朗读 / 说话 / 唱歌 / 语音识别 / 转文字 / 听写 / ASR / 音色设计 / 音色克隆 / 声音克隆 / voice design / voice clone / voice / speech / read aloud / transcribe / speech-to-text / 语音转文字 / 音频转文字。 Use when: 用户要求将文字转为语音、朗读文本、生成音频、识别音频内容、将音频转为文字、设计音色、克隆音色。

skill-install — Terminal

Install via CLI (Recommended)

clawhub install openclaw/skills/skills/aaroncxxx/mimo-tts-asr
Or

Xiaomi MiMo-V2.5-TTS-Series + ASR — 你的声音,随心所"驭"

v2.5.4 · 面向 Agent 时代的全链路语音模型系列

官方资源 / Official Links

资源链接
📖 发布公告MiMo-V2.5-TTS-Series + ASR 正式发布
📚 TTS API 文档语音合成(MiMo-V2.5-TTS 系列)
📚 ASR API 文档音频理解
🎮 MiMo Studio 体验aistudio.xiaomimimo.com/#/c
🔧 官方 Skill 仓库github.com/XiaomiMiMo/MiMo-Skills
🤗 ASR 开源代码github.com/XiaomiMiMo/MiMo-V2.5-ASR
🤗 ASR 模型权重huggingface.co/XiaomiMiMo/MiMo-V2.5-ASR
🤗 ASR Demohuggingface.co/spaces/XiaomiMiMo/MiMo-V2.5-ASR
📋 定价与限速定价说明
🌐 MiMo 开放平台platform.xiaomimimo.com

功能概览 / Overview

TTS — 三款模型

模型能力场景
🎙️ MiMo-V2.5-TTS内置精品音色,语速/情绪/语气精细控制通用语音合成
🎨 MiMo-V2.5-TTS-VoiceDesign自然语言描述从零生成新音色(无需参考音频)游戏NPC/虚拟主播/品牌IP
🔁 MiMo-V2.5-TTS-VoiceClone短音频高保真克隆音色(数秒即可)播客克隆/配音复刻

三款模型均已限时免费

ASR — 语音识别

能力说明
🌍 中英双语自由切换,无需预设语种
🗣️ 中文方言吴语/粤语/闽南语/四川话
🔀 Code-Switch中英混杂自然转录
🎵 歌曲识别中英文歌词,伴奏场景高精度
🔊 强噪音高噪音/远场拾音鲁棒识别
👥 多说话人会议等多人交叉对话
📝 原生标点结合韵律与语义自动标点

🆓 ASR 已开源GitHub / HuggingFace


⚙️ 配置 / Setup

环境变量

# TTS API Key(独立于模型推理 Key)
export MIMO_API_KEY="your-tts-api-key"

# ASR API Key(如与 TTS 相同可复用)
export MIMO_ASR_KEY="your-asr-api-key"

或通过 OpenClaw 配置:

openclaw config set skills.entries.mimo-tts-asr.apiKey "your-key"

⚠️ TTS/ASR 的 API Key 独立于模型推理 Key,需前往 platform.xiaomimimo.com 申请。


🎙️ TTS — 语音合成

基础用法

python3 "{baseDir}/scripts/tts.py" "要合成的文本" -o output.wav

参数说明

参数默认值说明
text(必填)要合成的文本
-ooutput.wav输出文件路径
-mtts模型:tts / voice-design / voice-clone
-vmimo_default音色(见音色列表)
-s风格标签
-fwav音频格式:wav / mp3 / ogg
--voice-descVoiceDesign:音色描述文本
--ref-audioVoiceClone:参考音频路径
--user-msg用户角色上下文(调整语气)
--api-key环境变量API Key 覆盖
--max-retries3最大重试次数
--list-voices列出可用音色
--list-formats列出可用格式

音色列表(MiMo-V2.5-TTS)

Metadata

Author@aaroncxxx
Stars4473
Views0
Updated2026-05-01
View Author Profile
AI Skill Finder

Not sure this is the right skill?

Describe what you want to build — we'll match you to the best skill from 16,000+ options.

Find the right skill
Add to Configuration

Paste this into your clawhub.json to enable this plugin.

{
  "plugins": {
    "official-aaroncxxx-mimo-tts-asr": {
      "enabled": true,
      "auto_update": true
    }
  }
}
Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.