Back to Registry
View Author Profile
Official Verified
Thu Thesis
Skill by chao1208
skill-install — Terminal
Install via CLI (Recommended)
clawhub install openclaw/skills/skills/chao1208/thu-thesisOr
name: thu-thesis description: 清华大学毕业论文 Word → PDF 一键格式规范化工具。输入任意 Word (.docx) 格式的清华毕业论文,自动转换为符合清华 thuthesis 官方 LaTeX 模板规范的高质量 PDF。适用于所有清华学位论文(MBA/学硕/专硕),一条命令搞定。功能:自动提取章节结构、中英文摘要、参考文献(自动生成 BibTeX)、图片(含 caption)、表格(含表头和标题)、致谢、个人简历;自动生成符号和缩略语说明(含孤儿缩略语检测与正文首次出现处自动补写);自动生成插图清单和附表清单;输出完整 thuthesis LaTeX 项目并编译为 PDF。运行时依赖:python-docx、jinja2、xelatex/bibtex(TeX Live);setup.sh 会从 GitHub 克隆 thuthesis 到 /tmp/thuthesis-latest。Use when: 用户需要把 Word 格式的清华毕业论文转为规范 PDF,或需要对毕业论文做格式规范化处理。
清华 MBA 论文 Word → PDF 一键转换
⚠️ 核心操作原则(不得违反)
只从 Word 中提取信息,不修改 thuthesis 模板格式。
- thuthesis 的封面、页眉、目录、参考文献、图表样式等,全部由
thuthesis.cls自动生成- 脚本只负责把 Word 里的内容(标题、摘要、章节、图表、参考文献等)提取出来填入
.tex文件- 若 Word 中某字段缺失,对应 LaTeX 字段留空,不删除、不跳过、不用占位符替代
- 任何格式上的"改进"都必须以
assets/databk/中的官方示例为准,不得自行发挥
架构:新三层 AI-native 流程
Word 文件
↓ [extract_raw.py] 纯机械提取,无 LLM
raw_xxx.json + 文档骨架(段落 idx + 样式 + 文字)
↓ [我(AI)阅读骨架] 理解章节结构
struct_xxx.json(章节划分、段落 idx 映射)
↓ [build_parsed.py] 纯 Python 组装,无 LLM
parsed_xxx.json
↓ [render.py] 填充 thuthesis LaTeX 模板
LaTeX 项目目录
↓ [xelatex + bibtex] 编译
thesis.pdf ✅
↓ [我(AI)Rubric 评测] 阅读产物,逐项打分 + 自动修复
evaluation_report.md
关键设计原则:Python 脚本不调用任何 LLM,不持有 API key。AI 在两个关键环节介入:(1) 阅读骨架生成 struct.json;(2) Rubric 评测 + 自动修复。
依赖
pip3 install python-docx jinja2 matplotlib
# 需要已安装 TeX Live
格式参考:assets/databk/
assets/databk/ 是从官方 thuthesis 项目备份的原始示例 data 文件,是本工具一切格式决策的黄金标准:
| 文件 | 参考内容 |
|---|---|
chap01.tex ~ chap04.tex | 正文章节、三线表、图片、公式格式 |
abstract.tex | 中英文摘要格式 |
denotation.tex | 缩略语/符号说明格式 |
acknowledgements.tex | 致谢格式 |
resume.tex | 个人简历格式 |
遇到任何格式问题,先查 databk/ 里的对应文件,再动代码。
初次使用 / 更新格式参考
# SKILL_DIR = 本 skill 的根目录(thu-thesis/)
SKILL_DIR="$(cd "$(dirname "$0")/.." && pwd)" # 在 scripts/ 内执行时
# 或直接写绝对路径,例如:
# SKILL_DIR="/path/to/skills/thu-thesis"
bash "$SKILL_DIR/scripts/setup.sh" "$SKILL_DIR"
setup.sh 做三件事:
- 从 GitHub clone(首次)或
git pull(已有)最新 thuthesis 到/tmp/thuthesis-latest - 编译生成
thuthesis.cls(如尚未生成) rm -rf assets/databk/ && cp -r data/ assets/databk/→ 保持格式参考始终为最新版本
每次 thuthesis 版本有重大更新时,重跑 setup.sh 即可刷新 databk。
输出路径规范
LaTeX 工程输出位置:与输入 .docx 同目录,子文件夹命名为 <原文件名去扩展>-latex。
例如:输入 /path/to/foo.docx,则 LaTeX 工程输出到 /path/to/foo-latex/。
- 中间临时文件(raw/struct/parsed JSON)放在 workspace 临时目录,转换完成后可清理
- 最终交付给用户的是
-latex/目录(含thesis.pdf)
完整转换流程
Step 1:机械提取(同时创建 LaTeX 工程目录)
# SKILL_DIR = 本 skill 根目录,按实际安装路径设置
SKILL_DIR="/path/to/skills/thu-thesis"
python3 "$SKILL_DIR/scripts/convert.py" extract /path/to/论文.docx output/
extract 会立即做两件事:
- 在
.docx同目录创建<stem>-latex/工程目录(项目开始即确定输出位置) - 机械提取,输出
output/raw_xxx.json+ 终端骨架
终端输出示例:
📄 输入: /path/to/foo.docx
📁 中间文件: output/
📁 LaTeX 工程: /path/to/foo-latex/ ← 已创建
📊 图片: 5 张 | para_idx: [102, 115, ...]
📊 表格: 3 张 | before_para: [88, 134, ...]
Metadata
AI Skill Finder
Not sure this is the right skill?
Describe what you want to build — we'll match you to the best skill from 16,000+ options.
Find the right skill Add to Configuration
Paste this into your clawhub.json to enable this plugin.
{
"plugins": {
"official-chao1208-thu-thesis": {
"enabled": true,
"auto_update": true
}
}
}Safety NoteClawKit audits metadata but not runtime behavior. Use with caution.