Back to Registry View Author Profile
Official Verified productivity Safety 5/5
mineru
用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。
Why use this skill?
使用 OpenClaw MinerU 技能,将 PDF、PPT、Word 和图片快速解析为结构化 Markdown。支持公式、表格识别与 OCR,是学术论文与文档处理的神器。
skill-install — Terminal
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/easonai-5589/mineruOr
What This Skill Does
MinerU 是 OpenDataLab 推出的一款深度文档解析与结构化工具,专门用于将各种复杂的非结构化文档转化为干净、可编辑的 Markdown 格式。该技能不仅支持常见的 PDF 文件,还能够高效处理 Word 文档、PPT 以及包含文字的图片。其核心技术亮点在于对公式、复杂表格以及多栏版面的卓越识别能力。通过集成 MinerU API,该插件可以无缝嵌入 OpenClaw 工作流中,将原本难以处理的学术论文、技术文档或扫描件快速转换为便于 AI 阅读或 LLM 输入的格式。无论是提取 LaTeX 公式,还是处理图文混排的版面,MinerU 都能提供专业级的解析质量。
Installation
要安装此技能,请在 OpenClaw 命令行界面中运行以下命令:
clawhub install openclaw/skills/skills/easonai-5589/mineru
安装完成后,请确保已通过环境变量配置您的 API 密钥:
export MINERU_TOKEN="your_api_key_here"
Use Cases
- 学术研究:自动抓取 ArXiv 论文,将其转换为 Markdown,保留数学公式以供 AI 深度理解与摘要。
- 文档数字化:将纸质文档扫描件或图片转化为结构化文字,极大提升办公效率。
- 数据清洗:从复杂的报告中提取关键表格数据,转化为易于处理的 Markdown 表格格式。
- 知识库构建:批量解析旧版 PPT 和 PDF 文档,将其归档为标准的知识库 Markdown 内容。
Example Prompts
- "使用 MinerU 解析 https://arxiv.org/pdf/2410.17247 这篇论文,并输出为 Markdown 格式,要求保留其中的 LaTeX 公式。"
- "我有几个存放在本地的扫描版 PDF,请使用 MinerU 批量处理,并告诉我解析进度。"
- "解析这个 PPT 文件,提取其中的表格和文字内容,并直接总结该文档的核心观点。"
Tips & Limitations
- 性能优化:对于极度复杂的版面,推荐使用
layoutlmv3模型以获得更高精度,若追求速度,则默认doclayout_yolo更佳。 - 资源限制:单次任务限制最大为 200MB 的文件大小或 600 页内容,超过此限制请先进行分卷处理。
- 环境兼容:由于输出结果包含 ZIP 压缩包,建议配合 OpenClaw 的文件系统工具使用,以实现自动解压与内容整合。
- 网络要求:API 解析任务依赖外部网络,请确保调用时网络通畅,并正确处理异步轮询逻辑以获取最终结果。
Metadata
AI Skill Finder
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skill Add to Configuration
Paste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-easonai-5589-mineru": {
"enabled": true,
"auto_update": true
}
}
}Tags(AI)
#pdf-parsing#ocr#document-processing#markdown#academic-research
Safety Score: 5/5
Flags: network-access, file-write, file-read, external-api