返回顶部
a

agentic-paper-digest-skill论文摘要技能

Fetches and summarizes recent arXiv and Hugging Face papers with Agentic Paper Digest. Use when the user wants a paper digest, a JSON feed of recent papers, or to run the arXiv/HF pipeline.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.3.3
安全检测
已通过
3,167
下载量
免费
免费
5
收藏
概述
安装方式
版本历史

agentic-paper-digest-skill

Agentic Paper Digest

使用场景

  • - 从arXiv和Hugging Face获取最新论文摘要。
  • 为下游智能体生成JSON输出。
  • 在需要轮询工作流时运行本地API服务器。

前置条件

  • - Python 3及网络访问权限。
  • 通过OPENAIAPIKEY或通过LITELLMAPIBASE + LITELLMAPIKEY使用兼容OpenAI的提供商进行LLM访问。
  • git为可选(用于引导);否则使用curl/wget(或Python)下载仓库。

获取代码并安装

  • - 推荐:运行引导辅助脚本。它会优先使用git(如果可用),否则回退到zip下载。

bash
bash {baseDir}/scripts/bootstrap.sh

  • - 通过设置PROJECT_DIR覆盖克隆位置。

bash
PROJECTDIR=$HOME/agenticpaper_digest bash {baseDir}/scripts/bootstrap.sh

运行(推荐CLI)

bash
bash {baseDir}/scripts/run_cli.sh

  • - 根据需要传递CLI标志。

bash
bash {baseDir}/scripts/run_cli.sh --window-hours 24 --sources arxiv,hf

运行(可选API)

bash
bash {baseDir}/scripts/run_api.sh

  • - 触发运行并读取结果。

bash
curl -X POST http://127.0.0.1:8000/api/run
curl http://127.0.0.1:8000/api/status
curl http://127.0.0.1:8000/api/papers

  • - 如需停止API服务器。

bash
bash {baseDir}/scripts/stop_api.sh

输出

  • - CLI的--json参数输出runid、seen、kept、windowstart和windowend。
  • 数据存储:data/papers.sqlite3(位于PROJECTDIR下)。
  • API:POST /api/run、GET /api/status、GET /api/papers、GET/POST /api/topics、GET/POST /api/settings。

配置

配置文件位于PROJECTDIR/config。环境变量可在shell中设置,或通过.env文件设置。此处的包装器会自动从PROJECTDIR加载.env(可通过ENV_FILE=/path/to/.env覆盖)。

环境变量(.env或导出的变量)

  • - OPENAIAPIKEY:OpenAI模型必需(litellm读取此项)。
  • LITELLMAPIBASE、LITELLMAPIKEY:使用兼容OpenAI的代理/提供商。
  • LITELLMMODELRELEVANCE、LITELLMMODELSUMMARY:用于相关性和摘要的模型(摘要默认使用相关性模型,如未设置)。
  • LITELLMTEMPERATURERELEVANCE、LITELLMTEMPERATURESUMMARY:较低值可获得更确定性的输出。
  • LITELLMMAXRETRIES:LLM调用的重试次数。
  • LITELLMDROPPARAMS=1:丢弃不支持的参数以避免提供商错误。
  • WINDOWHOURS、APPTZ:时效窗口和时区。
  • ARXIVCATEGORIES:逗号分隔的类别(默认包含cs.CL,cs.AI,cs.LG,stat.ML,cs.CR)。
  • ARXIVAPIBASE、HFAPIBASE:如需覆盖源端点。
  • ARXIVMAXRESULTS、ARXIVPAGESIZE:arXiv分页限制。
  • MAXCANDIDATESPERSOURCE:LLM过滤前每个源的最大候选数上限。
  • FETCHTIMEOUTS、REQUESTTIMEOUTS:源获取和每次请求的超时时间。
  • ENABLEPDFTEXT=1:在摘要中包含PDF首页文本;需要PyMuPDF(pip install pymupdf)。
  • DATADIR:papers.sqlite3的位置。
  • CORSORIGINS:API服务器允许的逗号分隔源(UI使用)。
  • 路径覆盖:TOPICSPATH、SETTINGSPATH、AFFILIATIONBOOSTSPATH。

配置文件

  • - config/topics.json:主题列表,包含id、label、description、maxpertopic和keywords。相关性分类器必须输出与此处定义完全一致的主题ID。当applytopiccaps=1时,maxpertopic也会限制GET /api/papers的结果。
  • config/settings.json:覆盖获取限制(arxivmaxresults、arxivpagesize、fetchtimeouts、maxcandidatesper_source)。通过POST /api/settings更新。
  • config/affiliations.json:{pattern, weight}列表,通过子字符串匹配对所属机构进行加权。权重累加,上限为1.0。无效JSON会禁用加权,因此请保持文件为严格JSON格式(无尾随逗号)。

强制工作流(按步骤执行)

  1. 1. 首先必须打开并阅读从GitHub仓库下载的配置:https://github.com/matanle51/agenticpaperdigest
- 加载config/topics.json、config/settings.json和config/affiliations.json(如存在)。 - 在询问用户更改前,先记录当前主题ID、上限和获取限制。
  1. 2. 请用户提供以下偏好(帮助用户)
- 感兴趣的主题 → 更新config/topics.json(topics[].id/label/description/keywords、maxpertopic)。 显示当前默认值,询问是否保留或更改。 - 时间窗口(小时) → 设置WINDOW_HOURS(或向CLI传递--window-hours)仅当用户在意时;否则保持默认24小时。 - 请用户填写以下参数(向用户解释其意图):ARXIVCATEGORIES、ARXIVMAXRESULTS、ARXIVPAGESIZE、MAXCANDIDATESPERSOURCE。 询问是否保留默认值并显示当前值。 - 模型/提供商 → 设置OPENAIAPIKEYLITELLMAPIKEY(+ 如使用代理则设置LITELLMAPIBASE),并设置LITELLMMODELRELEVANCE/LITELLMMODELSUMMARY。 - 默认不询问:时区、质量与成本、超时、PDF文本、所属机构偏置、源列表。除非用户要求更改,否则使用默认值。
  1. 3. 确认工作空间路径:询问克隆/运行位置。如果用户不在意,默认使用PROJECTDIR=$HOME/agenticpaper_digest。切勿硬编码/Users/...路径。
  2. 引导仓库:运行引导脚本(除非仓库已存在且用户表示跳过)。
  3. 创建或验证.env
- 如果.env缺失,从.env.example(在仓库中)创建,然后请用户填写密钥和任何请求的偏好。 - 在运行前确保至少设置了OPENAIAPIKEY或LITELLMAPIKEY之一。
  1. 6. 应用配置更改
- 直接编辑JSON文件(或如果运行API,使用POST /api/topics和POST /api/settings)。
  1. 7. 运行流水线
- 对于一次性JSON输出,优先使用scripts/run_cli.sh。 - 仅当用户明确要求UI/API访问或轮询时,使用scripts/run_api.sh。
  1. 8. 报告结果
- 如果结果稀疏,建议增加WINDOWHOURS、ARXIVMAX_RESULTS或拓宽主题。

获得良好结果

  • - 帮助用户定义并保持主题聚焦且互斥,以便分类器能选择正确的ID。
  • 如果质量重要,对摘要使用比相关性更强的模型。
  • 如果使用OpenAI模型,默认使用gpt-5-mini以获得良好平衡。
  • 当结果稀疏时增加WINDOWHOURS或ARXIVMAXRESULTS,当结果过于嘈杂时降低它们。
  • 根据研究领域调整ARXIVCATEGORIES。
  • 当摘要过于简略时启用PDF文本(ENABLEPDFTEXT=1)。
  • 使用适度的所属机构权重来偏置排名,而不淹没相关性。
  • 主动帮助用户调整技能以获得良好结果!

故障排除

  • - 端口8000被占用:运行bash

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 agentic-paper-digest-skill-1776360280 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 agentic-paper-digest-skill-1776360280 技能

通过命令行安装

skillhub install agentic-paper-digest-skill-1776360280

下载

⬇ 下载 agentic-paper-digest-skill v0.3.3(免费)

文件大小: 6.27 KB | 发布时间: 2026-4-17 16:30

v0.3.3 最新 2026-4-17 16:30
- Updated workflow instructions to prioritize proactive user interaction and guidance.
- Clarified that the user must first open and read the configuration from the downloaded GitHub repo.
- Emphasized assisting the user in providing preferences for topics, time window, and core parameters.
- Added a note to default to 24 hours for the time window unless the user specifies otherwise.
- Added recommendation to default OpenAI model to "gpt-5-mini" for optimal tradeoff.
- Added reminders for skill developers to help the user tune for good results.
- Minor edits for clarity, directness, and improved step-by-step guidance.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部