ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:DeepSop系列图片模型(S4.5、S5.0L、N1、N2系列、W2.7系列等,共11个模型)。 支持视频模型:DeepSop系列视频模型(S1.5Pro、Sora2系列、Veo3.1系列、Wan2.6/Wan2.7系列、Kling V3 Omni等,共15个模型)。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定具体模型(详见下方模型列表)。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/2393970875/image-video-generatorAI Image Generator
异步生成 AI 图片与视频的技能。
⚠️ 首次使用必读
1. 获取 API Key
访问 https://ai.deepsop.com/ 注册并登录,然后创建你的 API Key。
2. 设置环境变量
在使用前,你必须先设置自己的 API Key:
# Linux/macOS/Git Bash (Windows)
export AI_ARTIST_TOKEN="sk-your_api_key_here"
# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"
3. 验证配置
验证配置是否正确:
python3 scripts/test_config.py
详细配置说明请查看下方"环境配置"章节。
快速开始
# 图片生成(默认 DeepSop·3.1Nano2-Evo)
python3 scripts/generate_image.py "一只可爱的猫"
# 视频生成(默认 DeepSop·V3.1FB)
python3 scripts/generate_video.py "海边日落风景"
参考图/视频上传流程
当用户提供本地文件作为参考图或参考视频时,需要先调用文件上传 API 转换为可访问的 URL:
文件上传 API
curl --location --request POST 'https://ai.deepsop.com/prod-api/system/fileUpload/upload' \
--header 'x-api-key: sk-your_api_key_here' \
--form 'file=@"C:\\Users\\admin\\Downloads\\image.png"'
返回结果:
{
"msg": "操作成功",
"fileName": "image.png",
"code": 200,
"url": "https://kocgo-ai-sales-test.oss-cn-hangzhou.aliyuncs.com/material/100/xxx.png"
}
使用上传后的 URL
获取到 url 后,可作为 firstImageUrl、lastImageUrl、imageUrlList、videoUrlList 或 elementList 等参数传入生成接口。
在对话中直接返回图片/视频
方式 1: Markdown 语法(推荐)
生成图片后,直接在回复中使用 Markdown 语法:


平台支持情况:
- ✅ WebChat、Discord、Telegram:完全支持
- ✅ 飞书:支持(需公开 URL)
- ❌ WhatsApp:不支持
方式 2: 下载后发送(需要 message 工具)
使用 --download 参数下载媒体文件,然后通过 message 工具发送:
python3 scripts/generate_image.py "风景画" --download
python3 scripts/generate_video.py "海边" --download
比如图片生成接着在代码中读取图片并发送:
from scripts.generate_image import generate_image
import base64
result = generate_image(prompt="风景画", download=True)
if result and result["status"] == "SUCCESS":
# 方式 A: 使用 data URI
image_uri = result["data_uri"] # data:image/png;base64,...
# 方式 B: 读取本地文件
with open(result["local_path"], "rb") as f:
image_data = f.read()
base64_data = base64.b64encode(image_data).decode()
参数说明
通用参数
| 参数 | 默认值 | 说明 |
|---|---|---|
prompt | 必填 | 生成提示词(图片或视频描述) |
--model | 图片: DeepSop·3.1Nano2-Evo / 视频: DeepSop·V3.1FB | 生成模型(详见下方模型列表) |
--interval | 5 | 轮询间隔(秒) |
--download | - | 下载媒体文件到本地 |
--output-dir | workspace/images(图片) / workspace/videos(视频) | 文件保存目录 |
图片专属参数
| 参数 | 默认值 | 说明 |
|---|---|---|
--quality | 按模型自动匹配 | 图片质量:1K、2K、3K、4K(具体支持见下方模型能力表) |
--size | 按模型自动匹配 | 图片比例:1:1、3:4、4:3、16:9、9:16、2:3、3:2、4:5、5:4、1:4、4:1、1:8、8:1、21:9、auto(具体支持见下方模型能力表) |
--download | - | 下载图片到本地 |
--output-dir | workspace/images | 图片保存目录 |
--markdown-output | - | 以 Markdown 格式输出图片链接 |
--reference-image | - | 参考图本地路径,自动上传后作为 image-to-image 参考 |
--web-search | - | 开启联网搜索(仅 S5.0L 和 Nano2-Evo 支持) |
视频专属参数
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-2393970875-image-video-generator": {
"enabled": true,
"auto_update": true
}
}
}Related Skills
voice-clone
声音复刻技能,使用 AI Artist API 进行音色克隆和语音合成。支持查询已有音色、上传音频创建新音色、使用指定音色合成语音。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 触发场景: - 用户要求生成语音,如"用蔡总的音色说..."、"生成一段语音"、"语音合成"等。 - 用户要求克隆音色,如"上传音频创建音色"、"复刻这个声音"、"创建我的音色"等。 - 用户查询已有音色,如"有哪些音色"、"列出音色"、"查看音色列表"等。 - 用户指定音色名称或 ID 进行语音合成。 - 用户发送语音消息后要求用该声音合成其他内容。
ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:DeepSop系列图片模型(S4.5、S5.0L、N1、N2系列、W2.7系列等,共11个模型)。 支持视频模型:DeepSop系列视频模型(S1.5Pro、Sora2系列、Veo3.1系列、Wan2.6/Wan2.7系列、Kling V3 Omni等,共15个模型)。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定具体模型(详见下方模型列表)。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
ai-image-generator
AI 图片与视频异步生成技能,调用 AI Artist API 根据文本提示词生成图片或视频,自动轮询直到任务完成。 ⚠️ 使用前必须设置环境变量 AI_ARTIST_TOKEN 为你自己的 API Key! 获取 API Key:访问 https://ai.deepsop.com/ 注册登录后创建。 支持图片模型:**3.1Nano2-Evo(默认)**、S5.0L、N2、W2.7、W2.7Pro、Nano2-Beta-Evo。 支持视频模型:**V3.1FB(默认)**、S1.5Pro、V3.1PB、V3.1Fast、W2.6t / W2.6i / W2.6r、klingV3Omni、W2.7t / W2.7i / W2.7r。 查看当前服务端激活的模型请运行:`python3 scripts/generate_image.py --list-models`。 触发场景: - 用户要求生成图片,如"生成一匹狼"、"画一只猫"、"风景画"、"帮我画"等。 - 用户要求生成视频,如"生成视频"、"文生视频"、"图生视频"、"生成一段...的视频"等。 - 用户指定模型:N2、S5.0L、W2.7、W2.7Pro、3.1Nano2-Evo、Nano2-Beta-Evo、S1.5Pro、V3.1FB、V3.1PB、V3.1Fast、W2.6t、W2.6i、W2.6r、klingV3Omni、W2.7t、W2.7i、W2.7r。 - 用户上传参考图/参考视频时,自动先调用文件上传 API 转换为可访问 URL。
human-ai-collab
人机协作台技能。用户输入自然语言销售指令,AI自动分析拆解任务参数,调用 KocGo 平台接口提交任务,等待后查询 AiWa 挖掘客户数据,生成 xlsx 文件并返回。触发场景:用户说「帮我找客户」「挖掘XXX行业客户」「找XXX个客户」「提交任务」等与客户挖掘、销售任务相关的指令。需要提前配置环境变量 KOCGO_API_KEY。