ClawKit Logo
ClawKitReliability Toolkit
Back to Registry
Official Verified

paper-bilingual

将PDF论文转换为双语Markdown。对用户提供PDF URL或本地PDF文件,提取文本转为Markdown,保留图片,逐段插入中文翻译。用于学术论文研读、翻译对比。

skill-install — Terminal

Install via CLI (Recommended)

clawhub install openclaw/skills/skills/caottt/paper-bilingual
Or

Paper Bilingual

将PDF论文转换为中英双语Markdown,保留原文格式和图片,逐段提供中文翻译。

触发条件

用户要求以下操作时使用此skill:

  • "翻译这篇论文"
  • "把PDF转成双语MD"
  • "论文中英对照"
  • "下载论文转Markdown带翻译"
  • 提供PDF URL并要求翻译

输入

支持两种输入方式:

  1. URL输入:PDF的下载链接(http/https开头)
  2. 本地路径:本地PDF文件的绝对或相对路径

处理流程

步骤1:下载PDF

  • 如果是URL,使用PowerShell下载:
Invoke-WebRequest -Uri "URL" -OutFile "$env:TEMP\paper.pdf"
  • 如果是本地路径,直接使用

步骤2:PDF转Markdown

使用Python + PyMuPDF将PDF转为Markdown并提取图片:

import fitz
import os
from PIL import Image

pdf_path = "paper.pdf"
images_dir = "images"
figures_dir = "figures"
os.makedirs(images_dir, exist_ok=True)
os.makedirs(figures_dir, exist_ok=True)

doc = fitz.open(pdf_path)
pages = []

for page_num, page in enumerate(doc):
    # 提取文本
    text = page.get_text("text")
    
    # 提取图片
    images = []
    for img_index, img in enumerate(page.get_images()):
        xref = img[0]
        pix = fitz.Pixmap(doc, xref)
        if pix.n - pix.alpha > 0:  # 跳过透明图片
            img_name = f"page{page_num + 1}_img{img_index}.png"
            pix.save(os.path.join(images_dir, img_name))
            images.append(img_name)
        pix = None
    
    pages.append({'text': text, 'images': images})

步骤3:提取完整图表(推荐方法)

使用整页渲染+坐标裁剪提取完整图表:

import fitz
from PIL import Image

pdf_path = "paper.pdf"
OUTPUT_DIR = "figures"
os.makedirs(OUTPUT_DIR, exist_ok=True)

doc = fitz.open(pdf_path)
fig_count = 0

for page_num in range(len(doc)):
    page = doc[page_num]
    # 2x缩放渲染页面为高清图片
    pix = page.get_pixmap(matrix=fitz.Matrix(2, 2))
    img = Image.frombytes('RGB', [pix.width, pix.height], pix.samples)
    
    # 获取页面上的图片对象和位置
    images = page.get_images()
    
    for img_index, img_info in enumerate(images):
        xref = img_info[0]
        rects = page.get_image_rects(xref)
        for rect in rects:
            # 缩放坐标 (2x)
            x0 = max(0, int(rect.x0 * 2) - 20)
            y0 = max(0, int(rect.y0 * 2) - 20)
            x1 = min(pix.width, int(rect.x1 * 2) + 20)
            y1 = min(pix.height, int(rect.y1 * 2) + 20)
            
            # 过滤太小的图片碎片
            if x1 - x0 < 80 or y1 - y0 < 80:
                continue
            
            # 裁剪完整图表
            cropped = img.crop((x0, y0, x1, y1))
            fig_name = f'fig_p{page_num+1}_{img_index+1}.png'
            cropped.save(os.path.join(OUTPUT_DIR, fig_name))
            fig_count += 1

print(f"Extracted {fig_count} figures")

关键点

  • PDF里的图表可能被拆成多个小图片块(tiles)压缩
  • 直接提取会得到碎片,需要用坐标裁剪方法
  • 先渲染整页,再按图片坐标裁剪,确保图表完整

步骤4:翻译并生成双语MD

输出目录结构

memory/paper-bilingual/
└── YYYY-MM-DD-paper-name/
    ├── index.md          # 双语Markdown
    ├── images/           # 整页截图(可选)
    └── figures/          # 裁剪后的图表

输出格式

# 主标题
中文主标题

## Section 1
中文标题

原文段落...
中文翻译段落...

![Figure 1](figures/fig_p3_1.png)

原文段落...
中文翻译段落...

规则

  1. 主标题(#):英文后换行加中文
  2. 二级标题(##):英文后换行加中文
  3. 普通段落:原文后直接加翻译
  4. 图片:使用裁剪后的图表 figures/

步骤5:翻译实现

Metadata

Author@caottt
Stars4072
Views0
Updated2026-04-13
View Author Profile
AI Skill Finder

Not sure this is the right skill?

Describe what you want to build — we'll match you to the best skill from 16,000+ options.

Find the right skill
Add to Configuration

Paste this into your clawhub.json to enable this plugin.

{
  "plugins": {
    "official-caottt-paper-bilingual": {
      "enabled": true,
      "auto_update": true
    }
  }
}
Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.