ClawKit Logo
ClawKitReliability Toolkit
Back to Registry
Official Verified

Thu Thesis

Skill by chao1208

skill-install — Terminal

Install via CLI (Recommended)

clawhub install openclaw/skills/skills/chao1208/thu-thesis
Or

name: thu-thesis description: 清华大学毕业论文 Word → PDF 一键格式规范化工具。输入任意 Word (.docx) 格式的清华毕业论文,自动转换为符合清华 thuthesis 官方 LaTeX 模板规范的高质量 PDF。适用于所有清华学位论文(MBA/学硕/专硕),一条命令搞定。功能:自动提取章节结构、中英文摘要、参考文献(自动生成 BibTeX)、图片(含 caption)、表格(含表头和标题)、致谢、个人简历;自动生成符号和缩略语说明(含孤儿缩略语检测与正文首次出现处自动补写);自动生成插图清单和附表清单;输出完整 thuthesis LaTeX 项目并编译为 PDF。运行时依赖:python-docx、jinja2、xelatex/bibtex(TeX Live);setup.sh 会从 GitHub 克隆 thuthesis 到 /tmp/thuthesis-latest。Use when: 用户需要把 Word 格式的清华毕业论文转为规范 PDF,或需要对毕业论文做格式规范化处理。

清华 MBA 论文 Word → PDF 一键转换

⚠️ 核心操作原则(不得违反)

只从 Word 中提取信息,不修改 thuthesis 模板格式。

  • thuthesis 的封面、页眉、目录、参考文献、图表样式等,全部由 thuthesis.cls 自动生成
  • 脚本只负责把 Word 里的内容(标题、摘要、章节、图表、参考文献等)提取出来填入 .tex 文件
  • 若 Word 中某字段缺失,对应 LaTeX 字段留空,不删除、不跳过、不用占位符替代
  • 任何格式上的"改进"都必须以 assets/databk/ 中的官方示例为准,不得自行发挥

架构:新三层 AI-native 流程

Word 文件
  ↓ [extract_raw.py]  纯机械提取,无 LLM
raw_xxx.json + 文档骨架(段落 idx + 样式 + 文字)
  ↓ [我(AI)阅读骨架]  理解章节结构
struct_xxx.json(章节划分、段落 idx 映射)
  ↓ [build_parsed.py]  纯 Python 组装,无 LLM
parsed_xxx.json
  ↓ [render.py]        填充 thuthesis LaTeX 模板
LaTeX 项目目录
  ↓ [xelatex + bibtex] 编译
thesis.pdf ✅
  ↓ [我(AI)Rubric 评测]  阅读产物,逐项打分 + 自动修复
evaluation_report.md

关键设计原则:Python 脚本不调用任何 LLM,不持有 API key。AI 在两个关键环节介入:(1) 阅读骨架生成 struct.json;(2) Rubric 评测 + 自动修复。

依赖

pip3 install python-docx jinja2 matplotlib
# 需要已安装 TeX Live

格式参考:assets/databk/

assets/databk/ 是从官方 thuthesis 项目备份的原始示例 data 文件,是本工具一切格式决策的黄金标准

文件参考内容
chap01.tex ~ chap04.tex正文章节、三线表、图片、公式格式
abstract.tex中英文摘要格式
denotation.tex缩略语/符号说明格式
acknowledgements.tex致谢格式
resume.tex个人简历格式

遇到任何格式问题,先查 databk/ 里的对应文件,再动代码。

初次使用 / 更新格式参考

# SKILL_DIR = 本 skill 的根目录(thu-thesis/)
SKILL_DIR="$(cd "$(dirname "$0")/.." && pwd)"   # 在 scripts/ 内执行时
# 或直接写绝对路径,例如:
# SKILL_DIR="/path/to/skills/thu-thesis"
bash "$SKILL_DIR/scripts/setup.sh" "$SKILL_DIR"

setup.sh 做三件事:

  1. 从 GitHub clone(首次)或 git pull(已有)最新 thuthesis/tmp/thuthesis-latest
  2. 编译生成 thuthesis.cls(如尚未生成)
  3. rm -rf assets/databk/ && cp -r data/ assets/databk/ → 保持格式参考始终为最新版本

每次 thuthesis 版本有重大更新时,重跑 setup.sh 即可刷新 databk。

输出路径规范

LaTeX 工程输出位置:与输入 .docx 同目录,子文件夹命名为 <原文件名去扩展>-latex

例如:输入 /path/to/foo.docx,则 LaTeX 工程输出到 /path/to/foo-latex/

  • 中间临时文件(raw/struct/parsed JSON)放在 workspace 临时目录,转换完成后可清理
  • 最终交付给用户的是 -latex/ 目录(含 thesis.pdf

完整转换流程

Step 1:机械提取(同时创建 LaTeX 工程目录)

# SKILL_DIR = 本 skill 根目录,按实际安装路径设置
SKILL_DIR="/path/to/skills/thu-thesis"

python3 "$SKILL_DIR/scripts/convert.py" extract /path/to/论文.docx output/

extract 会立即做两件事:

  1. .docx 同目录创建 <stem>-latex/ 工程目录(项目开始即确定输出位置)
  2. 机械提取,输出 output/raw_xxx.json + 终端骨架

终端输出示例:

📄 输入: /path/to/foo.docx
📁 中间文件: output/
📁 LaTeX 工程: /path/to/foo-latex/      ← 已创建
📊 图片: 5 张  | para_idx: [102, 115, ...]
📊 表格: 3 张  | before_para: [88, 134, ...]

Metadata

Author@chao1208
Stars3875
Views0
Updated2026-04-07
View Author Profile
AI Skill Finder

Not sure this is the right skill?

Describe what you want to build — we'll match you to the best skill from 16,000+ options.

Find the right skill
Add to Configuration

Paste this into your clawhub.json to enable this plugin.

{
  "plugins": {
    "official-chao1208-thu-thesis": {
      "enabled": true,
      "auto_update": true
    }
  }
}
Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.