返回顶部
a

arxiv-summarizer-orchestrator arXiv摘要编排

End-to-end orchestration skill for periodic arXiv collection and reporting using three sub-skills: arxiv-search-collector, arxiv-paper-processor, and arxiv-batch-reporter. Supports manual language control across all markdown outputs and Stage-B processing strategy (`subagent_parallel` default max 5, or serial)."

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.1
安全检测
已通过
807
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

arxiv-summarizer-orchestrator

ArXiv 摘要生成编排器

通过组合三个子技能来运行完整流水线。

子技能顺序

  1. 1. arxiv-search-collector
  2. arxiv-paper-processor
  3. arxiv-batch-reporter

工作流参数

  • - language: 所有阶段使用的手动语言参数。省略时默认为英语。
  • paperprocessingmode: subagentparallel 或 serial。
  • maxparallelpapers: 当 paperprocessingmode=subagentparallel 时默认为 5。

工作流

阶段 A:收集设置 + 查询检索

  1. 1. 使用 arxiv-search-collector/scripts/initcollectionrun.py 初始化一次运行。
  2. 模型根据原始主题生成多个聚焦查询,并编写一个精简的 queryplan.json(仅包含 label + query)。
  3. 使用计划文件运行 arxiv-search-collector/scripts/fetchqueriesbatch.py(推荐)。
  4. (可选回退)手动调用 arxiv-search-collector/scripts/fetchquerymetadata.py 进行逐个获取。
  5. 模型读取每个索引查询列表并决定保留的索引。
  6. 使用 arxiv-search-collector/scripts/mergeselected_papers.py 合并选中的项目。
  7. 如果相关性/覆盖度仍不理想,迭代阶段 A:
- 使用新标签生成另一个查询计划, - 再次获取, - 使用 --incremental 和更新的 selection-json 重新合并。 - 将弱标签设置为空保留列表([])以明确丢弃。

向收集脚本传递 --language ,使阶段 A 中生成的所有 markdown 文件遵循所选语言。

在阶段 A 中使用保守控制的串行查询获取(例如 --min-interval-sec 5,--retry-max 4)。

默认收集器设置已包含重试/退避和运行本地节流状态(dir>/.runtime/arxivapi_state.json),因此通常无需手动调整。

优先使用缓存重用(不使用 --force),除非查询参数已更改或需要刷新数据。

输出:一个运行目录,包含每篇论文的元数据子目录。

阶段 B:每篇论文的工件下载 + 手动摘要

对于每个论文目录,调用一次子技能 arxiv-paper-processor,让该技能生成 /summary.md。

对于多篇论文,推荐的预处理步骤:

  1. 1. 在逐篇阅读之前,先运行一次批量工件下载:

bash
python3 arxiv-paper-processor/scripts/downloadpapersbatch.py \
--run-dir /path/to/run \
--artifact sourcethenpdf \
--max-workers 3 \
--min-interval-sec 5 \
--language

逐篇论文执行步骤(在 arxiv-paper-processor 内部):

  1. 1. 如果 dir>/summary.md 已存在且完整,则跳过此论文。
  2. 如果可用的源文件(source/sourceextract/*.tex)或 PDF(source/paper.pdf)已存在,则跳过下载。
  3. 如果工件缺失,使用 arxiv-paper-processor/scripts/downloadarxivsource.py 下载源文件。
  4. 如果源文件不可用,使用 arxiv-paper-processor/scripts/downloadarxivpdf.py 下载 PDF。
  5. 模型阅读内容,并按照参考格式手动编写 /summary.md,使用指定的 language。

多篇论文的并行策略:

  • - 默认:paperprocessingmode=subagentparallel,maxparallelpapers=5。
  • 可选:paperprocessingmode=serial,一次处理一篇论文。
  • 在并行模式下,分批运行多个 arxiv-paper-processor 实例;并发论文数不得超过 maxparallel_papers。
  • 等待一批完成后才开始下一批。
  • 在串行模式下,一次只运行一个 arxiv-paper-processor 实例。
  • 子代理工作进程应各自只拥有一个论文目录,以避免文件冲突。
  • 不要使用脚本自动生成摘要文本;脚本仅为下载工具。

输出:所有论文目录包含 summary.md。

阶段 C:打包 + 最终分层报告

  1. 1. 运行 arxiv-batch-reporter/scripts/collectsummariesbundle.py --language
  2. 模型读取 summariesbundle.md,并在基础目录中编写 collectionreporttemplate.md。
  3. 在模板中,每篇论文的叶子条目必须包含一个独立的占位行:{{ARXIVBRIEF:id>}}。
  4. 运行 arxiv-batch-reporter/scripts/rendercollectionreport.py 生成最终的 collectionreport.md。
  5. 不要在最终报告中手动改写每篇论文的结论行;它们必须通过脚本注入来自每篇论文的 summary.md 第10节。

如果 language 是非英语(例如中文),所有中间 markdown 文件和最终报告都应遵循该语言。

定期调度

此编排器适用于 OpenClaw 中的 cron/定时执行:

  • - 频率示例:每日、每周、每月。
  • 对于滚动窗口,在初始化运行时使用回溯(1d、7d、30d)。

输出布局

/--/

  • - taskmeta.json、taskmeta.md
  • queryresults/、queryselection/
  • id>/metadata.md + 下载的源文件/pdf + summary.md
  • summariesbundle.md
  • collectionreporttemplate.md
  • 最终渲染的收集报告(例如 collection_report.md)

使用 references/workflow-checklist.md 作为执行检查清单。

相关技能

这是顶层编排技能。

在使用之前,安装并启用这三个子技能:

  • - arxiv-search-collector
  • arxiv-paper-processor
  • arxiv-batch-reporter

此编排器内部的执行顺序:

  1. 1. arxiv-search-collector(阶段 A)
  2. arxiv-paper-processor(阶段 B)
  3. arxiv-batch-reporter(阶段 C)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 arxiv-summarizer-orchestrator-1776419948 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 arxiv-summarizer-orchestrator-1776419948 技能

通过命令行安装

skillhub install arxiv-summarizer-orchestrator-1776419948

下载

⬇ 下载 arxiv-summarizer-orchestrator v0.1.1(免费)

文件大小: 4.87 KB | 发布时间: 2026-4-17 18:16

v0.1.1 最新 2026-4-17 18:16
Document cross-skill relationships in all SKILL.md files

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部