li-feishu-audio
飞书语音交互技能。支持语音消息自动识别、AI 处理、语音回复全流程。需要配置 FEISHU_APP_ID 和 FEISHU_APP_SECRET 环境变量。使用 faster-whisper 进行语音识别,Edge TTS 进行语音合成,自动转换 OPUS 格式并通过飞书发送。适用于飞书平台的语音对话场景。
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/43622283/li-feishu-audioLi Feishu Audio - 飞书语音交互技能
快速开始
本技能提供完整的飞书语音交互能力:
用户语音 → faster-whisper 识别 → AI 处理 → Edge TTS 合成 → OPUS 转换 → 飞书发送
核心组件
1. 语音识别 (fast-whisper)
脚本: scripts/fast-whisper-fast.sh
用法:
./scripts/fast-whisper-fast.sh <音频文件.ogg>
配置:
- 模型:faster-whisper tiny
- 语言:中文 (zh)
- 模型目录:可配置(环境变量
FAST_WHISPER_MODEL_DIR) - 虚拟环境:技能目录下的
.venv(自动创建)
2. 语音合成 (Edge TTS)
脚本: scripts/tts-voice.sh
用法:
./scripts/tts-voice.sh "文本内容" [输出文件.mp3]
配置:
- 音色:zh-CN-XiaoxiaoNeural (中文女声)
- 输出格式:MP3 (自动转换为 OPUS)
- 虚拟环境:技能目录下的
.venv(自动创建)
3. 飞书语音发送
脚本: scripts/feishu-tts.sh
用法:
./scripts/feishu-tts.sh <音频文件.mp3> [用户 ID]
配置:
- 飞书 AppID: 从环境变量或 openclaw.json 读取
- 音频格式:OPUS (48kHz, 自动转换)
- 消息类型:audio
4. 自动清理
脚本: scripts/cleanup-tts.sh
用法:
./scripts/cleanup-tts.sh [保留数量]
定时任务: 每天凌晨 2 点自动执行
完整工作流
接收用户语音消息
- 飞书收到语音消息(OGG/OPUS 格式)
- 保存到 OpenClaw 媒体目录(自动处理)
- 调用
fast-whisper-fast.sh识别
生成回复
- 识别结果发送给大模型
- 大模型生成文字回复
- 调用
tts-voice.sh生成语音
发送语音回复
- TTS 生成 MP3 文件
sendMediaFeishu自动转换为 OPUS- 通过飞书 API 发送语音消息
环境要求
系统依赖
# Python
Python 3.11+
uv 包管理器
# 音频处理
ffmpeg (支持 OPUS 编码)
jq (JSON 处理)
# 飞书 API
飞书开放平台应用凭证
Python 环境
# 虚拟环境
技能目录/.venv (自动创建)
# 已安装包
faster-whisper==1.2.1
edge-tts==7.2.7
模型文件
# 语音识别模型
$FAST_WHISPER_MODEL_DIR/models--Systran--faster-whisper-tiny/
配置说明
飞书凭证
方法 1: 环境变量(推荐)
创建 .env 文件:
export FEISHU_APP_ID="cli_xxx"
export FEISHU_APP_SECRET="xxx"
方法 2: openclaw.json
{
"channels": {
"feishu": {
"enabled": true,
"appId": "cli_xxx",
"appSecret": "xxx"
}
}
}
⚠️ 安全提示:不要将凭证提交到版本控制系统!
自定义目录(可选)
在 .env 文件中配置:
# 模型目录(默认:$HOME/.fast-whisper-models)
export FAST_WHISPER_MODEL_DIR="/opt/fast-whisper-models"
# 虚拟环境目录(默认:技能目录/.venv)
export VENV_DIR="/path/to/venv"
# 临时文件目录(默认:/tmp)
export TEMP_DIR="/tmp"
# 日志目录(默认:技能目录/logs)
export LOG_DIR="/path/to/logs"
# OpenClaw 配置路径(默认:$HOME/.openclaw/openclaw.json)
export OPENCLAW_CONFIG="$HOME/.openclaw/openclaw.json"
TTS 配置
{
"messages": {
"tts": {
"auto": "always",
"provider": "edge",
"edge": {
"enabled": true,
"voice": "zh-CN-XiaoxiaoNeural",
"lang": "zh-CN"
}
}
}
}
脚本说明
fast-whisper-fast.sh
#!/bin/bash
# 语音识别脚本
export HF_ENDPOINT=https://hf-mirror.com # 国内镜像
VENV_PYTHON="技能目录/.venv/bin/python" # 由 install.sh 自动配置
# 用法
./fast-whisper-fast.sh <音频文件>
输出格式:
[0.00s -> 2.32s] 识别的文本内容
tts-voice.sh
#!/bin/bash
# TTS 语音生成脚本
export HF_ENDPOINT=https://hf-mirror.com
VENV_PYTHON="技能目录/.venv/bin/python"
# 用法
./tts-voice.sh "文本内容" [输出文件.mp3]
feishu-tts.sh
#!/bin/bash
# 飞书语音发送脚本
# 自动转换 MP3 → OPUS
# 用法
./feishu-tts.sh <音频文件.mp3> [用户 ID]
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-43622283-li-feishu-audio": {
"enabled": true,
"auto_update": true
}
}
}Related Skills
li_itil_manager
ITIL 5 Manager - Elite IT Service Management Advisor specializing in ITSM, FinOps, and IT governance using ITIL 5 DPSM framework.
Li Etl Handle Safe
Skill by 43622283
Li Doc Answer
Skill by 43622283
li-feishu-audio
飞书语音交互技能。支持语音消息自动识别、AI 处理、语音回复全流程。需要配置 FEISHU_APP_ID 和 FEISHU_APP_SECRET 环境变量。使用 faster-whisper 进行语音识别,Edge TTS 进行语音合成,自动转换 OPUS 格式并通过飞书发送。适用于飞书平台的语音对话场景。
li_sentry_check
Multi-platform server inspection and health check skill. SSH into remote Linux servers using key-based authentication, run read-only inspection commands (CPU, memory, disk, network, services, security), and generate structured Markdown reports with anomaly highlighting. Use when the user asks to inspect servers, run health checks, check system metrics, perform 巡检/巡查, gather system status, or generate inspection reports. Compatible with nanobot, OpenClaw, and Hermes agent.