返回顶部
a

arxiv-paper-processor 论文处理工具

Tool-only paper processing skill with a manual language parameter: supports batch artifact download for many papers or single-paper download, then the model manually reads source/PDF and writes summary.md in the selected language. Use when per-paper comprehension should be model-driven instead of script-generated."

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.1
安全检测
已通过
1,745
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

arxiv-paper-processor

ArXiv论文处理器

使用此技能进行单篇论文的手动摘要生成,并可选择批量下载工件。

  • - 单篇论文模式:处理一个论文目录(例如 dir>/id>/)。
  • 批量预下载模式:在写入摘要前,处理同一运行目录下的多个论文目录。

语言参数

  • - 使用工作流语言参数(例如 English 或 Chinese)并手动应用。
  • 每篇论文的 summary.md 必须使用所选语言编写。
  • 如果直接调用下载脚本,请传递 --language 以确保可追溯性。

核心原则

脚本仅负责获取工件。模型负责阅读和撰写。

不可协商的约束

  • - 不得通过基于脚本的片段提取、正则表达式收集或模板自动填充来生成 summary.md。
  • 不得使用 Python/shell 脚本从摘要/引言片段自动组合章节文本。
  • 此技能中的脚本仅用于工件下载(source/pdf)和跟踪日志。
  • 最终的 summary.md 必须来自模型侧对论文内容的阅读和综合。

可选的批量工件下载(多篇论文)

当阶段 B 包含多篇论文时,首先使用此功能:

bash
python3 scripts/downloadpapersbatch.py \
--run-dir /path/to/run \
--artifact sourcethenpdf \
--max-workers 3 \
--min-interval-sec 5 \
--language English

关键行为:

  • - 支持 --artifact source、--artifact pdf 或 --artifact sourcethenpdf(默认)。
  • 支持并发(--max-workers)和安全限流/重试(--min-interval-sec、重试参数)。
  • 默认使用运行本地限流状态(dir>/.runtime/arxivdownloadstate.json)以降低 429 风险。
  • 跳过已拥有可用 source/sourceextract/*.tex 或现有 source/paper.pdf 的论文(除非使用 --force)。
  • 支持断点续传:如果某篇论文已有完整的 summary.md,可跳过该论文的摘要编写步骤。
  • 默认将批量日志写入 dir>/downloadbatch_log.json。

步骤 1:下载源文件(首选)

bash
python3 scripts/downloadarxivsource.py \
--paper-dir /path/to/run/2602.00528 \
--language English

此命令会写入:

  • - source/sourcebundle.bin
  • source/sourceextract/
  • source/downloadsourcelog.json

如果可用的源文件已存在且未设置 --force,脚本将重用本地工件。

步骤 2:如有需要,下载 PDF

bash
python3 scripts/downloadarxivpdf.py \
--paper-dir /path/to/run/2602.00528 \
--language English

此命令会写入:

  • - source/paper.pdf
  • source/downloadpdflog.json

如果 PDF 已存在且未设置 --force,脚本将重用本地工件。

步骤 3:模型阅读并生成摘要

  1. 1. 如果 summary.md 已存在且符合要求的格式,跳过该论文并标记为完成。
  2. 首先阅读 metadata.md。
  3. 如果 source/source_extract/ 已存在且包含可读的 .tex 文件,直接使用。
  4. 否则,如果 source/paper.pdf 已存在,直接使用 PDF。
  5. 如果两者都不存在,先运行下载脚本(单篇论文脚本或批量脚本)。
  6. 在同一论文目录中,使用所选语言手动编写 summary.md。

不要依赖基于规则的自动摘要生成。
不要将自动提取的片段作为主要的编写依据。

质量要求

  • - 每个章节都应包含可追溯到全文阅读的论文特定细节。
  • 第 4/5/10 节应反映具体的方法和评估细节,而非通用措辞。
  • 如果源文件中关键细节不明确,请明确标注不确定性,而非猜测。
  • 与 references/summary-example-en.md 和 references/summary-example-zh.md 中展示的详细程度相匹配。
  • 如果您的草稿明显比示例更短或更不具体,请在完成前进行扩展。

必需输出

  • - /summary.md,采用固定章节格式。
  • 特别注意 ## 10. Brief Conclusion 章节:撰写 3-4 句的简短结论,涵盖贡献、方法、评估设置和结果,并包含论文特定细节。
  • 在 ## 1. Paper Snapshot 章节中,使用精确键名:ArXiv ID、Title、Authors、Publish date、Primary category、Reading basis。
  • 不要使用诸如 Reading source、Author list、Published on 或小写键名等变体。

具体章节要求请参见 references/summary-format.md。

相关技能

此技能是 arxiv-summarizer-orchestrator 的子技能。

流水线位置:

  1. 1. 步骤 1(上游):arxiv-search-collector 生成选定的论文目录和元数据。
  2. 步骤 2(本技能):arxiv-paper-processor 下载工件并为每篇论文编写一个 summary.md。
  3. 步骤 3(下游):arxiv-batch-reporter 使用这些单篇论文摘要生成最终的集合报告。

将本技能与步骤 1 和步骤 3 结合使用,以实现完整的端到端执行。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 arxiv-paper-processor-1776419948 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 arxiv-paper-processor-1776419948 技能

通过命令行安装

skillhub install arxiv-paper-processor-1776419948

下载

⬇ 下载 arxiv-paper-processor v0.1.1(免费)

文件大小: 23.15 KB | 发布时间: 2026-4-17 19:30

v0.1.1 最新 2026-4-17 19:30
Document cross-skill relationships in all SKILL.md files

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部