返回顶部
p

pdf-renamePDF重命名

Rename academic PDF papers to a standardized format "[Year] [Venue] Title.pdf" using a three-stage pipeline (Extract → Verify → Rename). Use when the user asks to organize, batch-rename, or metadata-enrich PDF files in a folder. Activates on keywords like "rename PDFs", "organize papers", "batch rename PDFs", "rename papers by metadata", "pdf重命名", "文献整理".

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
103
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-rename

PDF Rename — 学术论文整理工具

将学术PDF重命名为:[年份] [会议/期刊] 标题.pdf

三阶段流程(严格顺序):

提取 → 验证 → 重命名

防错原则: 重命名阶段绝不重新解析PDF内容。清单是唯一的事实来源。



快速开始

bash

阶段1:提取元数据 → 生成清单


python scripts/extract.py <文件夹路径>

阶段2:验证(手动或网络搜索),然后注入已验证数据

→ 使用网络验证的值编辑 scripts/VERIFIED_DATA 字典

python scripts/apply_verified.py <文件夹路径>

阶段3:预览重命名方案

python scripts/execute.py <文件夹路径> --preview

执行重命名(含备份)

python scripts/execute.py <文件夹路径> --execute

工作流程详解

阶段1:提取

scripts/extract.py 读取文件夹中的每个PDF并生成 manifest.json。

对每个PDF提取:

  • - 标题:来自PDF首页文本(启发式:第一行非元数据内容)
  • 年份:来自文件名前缀(最可靠)或PDF文本(会议年份模式)
  • 会议/期刊:从PDF文本推断(NeurIPS、ICML、arXiv等)
  • 状态:needs_verification(标题/年份来自自动提取)

清单模式 — 参见 references/manifest_spec.md

⚠️ PDF文本提取对标题不可靠。预期质量:文件名 > PDF文本中的标题。执行重命名前务必通过网络搜索验证。

阶段2:验证

运行重命名前,手动或通过网络搜索验证:

  1. 1. 标题是否正确(文件名通常足够,但多词标题可能不同)
  2. 年份是否正确(arXiv提交年份 ≠ 会议年份)
  3. 会议/期刊是否正确

通过 scripts/apply_verified.py 注入已验证数据:

  • - 键 = 原始文件名(精确匹配)
  • 值 = {title, year, venue, confirmed: True}

设置 confirmed: False 或省略条目以跳过文件。

阶段3:重命名

scripts/execute.py 读取清单并重命名文件:

  • - 状态必须为 ready 才能执行
  • 重复标题 → 追加 (1)、(2) 等
  • 状态为 needsverification 或 manualreview 的文件将被跳过
  • 自动在 <文件夹>/backupYYYYMMDD_HHMMSS/ 创建备份



关键设计决策


问题解决方案
PDF标题提取乱码/不完整使用文件名作为主要标题来源;PDF文本仅用于会议/期刊和年份提示
arXiv ID与会议年份不一致
通过网络搜索验证;在 VERIFIED_DATA 中注入修正后的年份 |
| 重复论文(相同内容,不同文件名) | 通过标题相似度检测;使用 (1)、(2) 后缀重命名两者 |
| 意外数据丢失 | 重命名前始终创建带时间戳的备份 |


脚本


脚本用途
scripts/extract.py阶段1:提取PDF元数据 → manifest.json
scripts/apply_verified.py
阶段2:将验证数据注入清单 |
| scripts/execute.py | 阶段3:根据清单重命名文件(预览或执行) |
| scripts/find_duplicates.py | 工具:检测清单中的近似重复标题 |


参考资料

  • - references/manifestspec.md — 完整清单JSON模式
  • references/venueabbrev.md — 标准会议/期刊缩写映射表
  • references/anti_patterns.md — 常见错误及避免方法

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-rename-1775917382 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-rename-1775917382 技能

通过命令行安装

skillhub install pdf-rename-1775917382

下载

⬇ 下载 pdf-rename v1.0.0(免费)

文件大小: 10.24 KB | 发布时间: 2026-4-12 10:56

v1.0.0 最新 2026-4-12 10:56
- Initial release of pdf-rename: academic PDF bulk renaming tool.
- Standardizes filenames to "[Year] [Venue] Title.pdf" using a strict three-stage Extract → Verify → Rename pipeline.
- Emphasizes manual or web search verification to ensure accuracy of metadata before renaming.
- Automatically creates timestamped backups before any file operations.
- Provides utility scripts for metadata extraction, verification, renaming, and duplicate detection.
- Workflow and design decisions clearly documented in SKILL.md.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部