DocPilot
智能文档处理专家,支持文档解析、信息抽取、文档分类
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/ankylala/docpilotDocPilot — 智能文档处理专家
高精度文档处理技能,支持文档解析、信息抽取、文档分类。
为什么选择 DocPilot?
三层能力 + 六大核心优势
三层能力
- 解析 — 高精度识别文档内容,保留版面结构
- 抽取 — 按需求提取关键字段,每条结果都能溯源到原文位置
- 分类 — 自动识别文档类型,混合文档也能自动切分
六大核心优势
1. 证据溯源 — 每个字段都有"身份证" ⭐ 独家
{
"key": "合同金额",
"value": "¥1,200,000",
"confidence": "high",
"evidence": [{
"text": "合同总金额:¥1,200,000",
"page": 2,
"quad": [[120, 350], [480, 350], [480, 380], [120, 380]]
}]
}
审计、法务、财务场景必备 — 知道数据从哪来,才能相信数据是对的。
2. 混合文档切分 — 一份文件,多种类型 ⭐ 独家
上传一份包含"合同+发票+报价单"的混合文件,自动识别边界并逐段分类。
3. 印章检测 — 公章/签名章/骑缝章自动识别 ⭐ 独家
自动检测文档中的印章和签章,返回位置和类型信息,适用于合同审查、资质验证。
4. 跨页表格合并 — 断裂表格智能还原 ⭐ 独家
自动识别跨页断裂的表格,智能合并表头和表体,输出完整结构。
5. 手写字体识别 — 印刷+手写混合识别 ⭐ 独家
支持印刷体和手写体混合识别,覆盖表单填写、手写批注、签字确认等场景。
6. 全格式支持 — 一个技能全部搞定
PDF · 图片 · Word · Excel · CSV — 无需组合多个工具。
命令
解析文档
DocPilot parse <文件路径> [选项]
示例:
DocPilot parse C:\docs\report.pdf
DocPilot parse C:\docs\scan.jpg --output markdown
DocPilot parse C:\docs\data.xlsx
DocPilot parse C:\docs\contract.pdf --seal --bbox
信息抽取
DocPilot extract <文件路径> --schema <JSON>
示例:
DocPilot extract C:\docs\contract.pdf --schema "{\"fields\":[{\"key\":\"甲方\",\"type\":\"string\"},{\"key\":\"乙方\",\"type\":\"string\"}]}"
DocPilot extract C:\docs\invoice.pdf --schema schema.json
文档分类
DocPilot classify <文件路径> [选项]
示例:
DocPilot classify C:\docs\mixed.pdf
DocPilot classify C:\docs\docs.pdf --mode classify_and_split --categories "[{\"name\":\"合同\",\"description\":\"合同协议\"},{\"name\":\"发票\",\"description\":\"发票单据\"}]"
参数说明
parse 命令
| 参数 | 说明 | 示例 |
|---|---|---|
| 文件路径 | PDF/图片/Word/Excel 文件路径 | C:\docs\report.pdf |
| --output | 输出格式 (structured/markdown/text) | --output markdown |
| --layout | 启用版面分析 | --layout |
| --table | 启用表格识别(含跨页合并) | --table |
| --seal | 启用印章识别 | --seal |
| --dpi | DPI (72/144/200/216) | --dpi 200 |
| --pages | 页码范围 | --pages 1-5,8,10-12 |
| --bbox | 包含边界框坐标 | --bbox |
| --normalize | 返回格式化解析数据 (默认开启) | --normalize |
| --raw | 返回原始解析格式 | --raw |
| --include-image | markdown 中包含图片 | --include-image |
| --image-format | 图片格式 (url/base64) | --image-format url |
extract 命令
| 参数 | 说明 | 示例 |
|---|---|---|
| 文件路径 | 文档文件路径 | C:\docs\contract.pdf |
| --schema | 字段 schema(必填) | --schema '{"fields":[...]}' |
| --prompt | 提示词模式 schema | --prompt '{"fields":[...]}' |
| --schema-ref | 模板引用 | --schema-ref DocPilot/contract/v1 |
| --options | 扩展配置 | --options '{"mode":"fast"}' |
classify 命令
| 参数 | 说明 | 示例 |
|---|---|---|
| 文件路径 | 文档文件路径 | C:\docs\mixed.pdf |
| --mode | 分类模式 | --mode classify_and_split |
| --categories | 分类 schema | --categories '[{"name":"合同","description":"..."}]' |
配置
方式一:环境变量
DOCPilot_BASE_URL=https://docpilot.token-ai.com.cn
DOCPilot_API_KEY=your_api_key
Metadata
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skillPaste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-ankylala-docpilot": {
"enabled": true,
"auto_update": true
}
}
}Tags
Related Skills
icalendar-events-parser
Parse .ics / iCalendar files or URLs, expand recurring events (RRULE), filter by date range / keywords, and return clean list of events. Use this instead of manual parsing or other ical libraries when reliable recurrence expansion is needed.
career-compass
职场罗盘 by Barry — 一站式求职辅助 Skill。整合简历解析优化、公司调研(就业向)、同城职位搜索、模拟面试四大模块。输入个人信息/简历,自动生成简历优化方向、公司调研报告、招聘表单,并可进行模拟面试。
wechat-article-export
微信公众号多功能导出工具。將公眾號文章導出為長截圖(PNG)、PDF 或 Markdown,支持任選一種或多種格式。觸發詞:「導出微信文章」、「公眾號截圖」、「文章轉PDF」、「文章轉Markdown」、「微信導出」。
comparison-table-gen
Auto-generates comparison tables for concepts, drugs, or study results in Markdown format.
accounting-assistant
Buchhaltungs-Automatisierung mit EÜR-Erstellung, DATEV-Export, PDF-Beleganalyse und Steuer-Vorbereitung. Ideal für Freelancer und KMU.