ClawKit Logo
ClawKitReliability Toolkit
Back to Registry
Official Verified

minimax-pdf-ocr

使用 MiniMax Vision API 识别 PDF/图片中的文字

skill-install — Terminal

Install via CLI (Recommended)

clawhub install openclaw/skills/skills/chongjie-ran/minimax-pdf-ocr
Or

MiniMax OCR Skill

使用 MiniMax Vision API 识别 PDF/图片中的文字内容,支持中文和英文。

功能

  • PDF 转图片(使用 poppler)
  • MiniMax Vision API 文字识别
  • 输出 Markdown 格式

依赖

# 安装 Node.js 依赖
cd minimax-pdf-ocr
npm install openai pdf2image

# 安装系统依赖
brew install poppler

使用方法

命令行

# 设置 API Key
export MINIMAX_API_KEY="your-api-key"

# 运行 OCR
node pdf-ocr-minimax.js <pdf文件路径> [输出目录]

# 示例
node pdf-ocr-minimax.js ./document.pdf ./output/

作为 Skill 使用

在 JavaScript 代码中调用:

const { recognizePdf } = require('./pdf-ocr-minimax.js');

await recognizePdf('/path/to/document.pdf', './output/');

环境变量

变量说明必填
MINIMAX_API_KEYMiniMax API Key (从 platform.minimaxi.com 获取)
OUTPUT_DIR输出目录否(默认当前目录)

输出

  • 识别结果保存为 .md 文件
  • 包含所有页面的文字内容
  • 保持原有格式和段落结构

示例输出

# 文档名称

## 第 1 页

这里是第一页的文字内容...

## 第 2 页

这里是第二页的文字内容...

注意事项

Metadata

Stars3683
Views5
Updated2026-04-01
View Author Profile
AI Skill Finder

Not sure this is the right skill?

Describe what you want to build — we'll match you to the best skill from 16,000+ options.

Find the right skill
Add to Configuration

Paste this into your clawhub.json to enable this plugin.

{
  "plugins": {
    "official-chongjie-ran-minimax-pdf-ocr": {
      "enabled": true,
      "auto_update": true
    }
  }
}

Tags

#pdf#ocr#minimax#recognition
Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.