返回顶部
d

daily-literature每日文献系统

Automated daily literature search system for academic researchers. Performs scheduled searches across PubMed, OpenAlex, and Semantic Scholar with automatic deduplication, OA download, smart categorization, and daily reports.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
185
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

daily-literature

每日文献检索技能

面向学术研究人员的自动化文献检索系统。在多个数据库(PubMed、OpenAlex、Semantic Scholar)中执行定时检索,自动去重结果,下载开放获取论文,并生成每日报告。

🎯 使用场景

  • - 每日文献监控:针对特定研究主题
  • 自动化论文收集:用于文献综述
  • 保持更新:掌握所在领域的最新出版物
  • 构建个人论文库:自动分类整理

📦 组件

1. 核心检索脚本(dailyliteraturesearch.py)

主执行脚本,具有以下功能:

  • - 多源检索:PubMed、OpenAlex、Semantic Scholar
  • 自动去重:按DOI(批次内 + 与本地库比对)
  • 开放获取检测:使用Unpaywall API识别开放获取论文
  • 自动下载:从PubMed Central或出版商网站下载开放获取论文
  • 智能分类:按主题对论文进行分类(可配置关键词)
  • 每日报告:生成包含检索统计信息的Markdown报告

2. 上传分析器(analyze_uploaded.py)

分析并分类手动上传的论文:

  • - 基于文件名的分类:使用关键词匹配
  • DOI提取:从文件名和元数据中提取
  • 批量处理:一次性处理多个文件
  • 报告生成:创建分类摘要

⚙️ 配置

目录结构

papers/
├── B-ALL/raw/ # 类别1(例如:B-ALL研究)
├── MM/raw/ # 类别2(例如:多发性骨髓瘤)
├── OTHER/raw/ # 其他论文
├── dailysearchlogs/ # 检索日志和报告
└── upload_temp/ # 临时上传目录

检索关键词(可自定义)

编辑 dailyliteraturesearch.py 中的 SEARCH_KEYWORDS:

python
SEARCH_KEYWORDS = [
奥加伊妥珠单抗,
Elranatamab,
Teclistamab,
Talquetamab,
博纳吐单抗,
(CAR-T AND B-ALL),
]

分类关键词

编辑 analyzeuploaded.py 中的 BALLKEYWORDS 和 MMKEYWORDS,以匹配您的研究领域。

🚀 使用方法

手动执行

bash

运行每日检索


python3 papers/dailyliteraturesearch.py

分析上传的论文

python3 papers/analyze_uploaded.py

定时执行(Cron)

添加到crontab以实现自动每日检索:

bash

每日上午6:30检索


30 6 * /usr/bin/python3 /path/to/papers/dailyliteraturesearch.py >> /path/to/papers/dailysearchlogs/cron.log 2>&1

配置选项

参数默认值描述
MAXRESULTSPERKEYWORD10每个来源每个关键词的最大结果数
DATERANGE_DAYS
7 | 检索时间窗口(最近N天) | | SOURCES | [pm, oa, s2] | 检索数据库 | | USER_EMAIL | — | 用于礼貌API访问(环境变量) |

📊 输出

每日报告示例

markdown

📚 每日文献检索报告


检索日期: 2026-03-18

📊 检索汇总
分类检索到成功下载付费墙
B-ALL28028
MM
24 | 0 | 24 |

| 总计 | 53 | 0 | 53 |

🔀 去重统计

  • - 原始检索结果:130 篇
  • 去重后文献:110 篇
  • 批次内重复:2 篇
  • 库中已有:18 篇

文件组织

  • - 报告:papers/dailysearchlogs/dailyreportYYYY-MM-DD.md
  • 日志:papers/dailysearchlogs/dailysearchYYYY-MM-DD.log
  • 论文:papers/{CATEGORY}/raw/{DOI}.pdf

🔧 高级功能

1. 库去重

自动将新结果与现有库进行比对:

  • - 扫描所有类别目录以查找现有DOI
  • 从文件名和历史日志中提取DOI
  • 跳过库中已有的论文
  • 报告重复统计信息

2. 开放获取检测

使用Unpaywall API识别开放获取论文:

python
isoa, oaurl = checkopenaccess(doi)
if is_oa:
downloadpaper(oaurl, save_path)

3. PubMed Central集成

自动尝试PMC获取生物医学论文:

python
if pmid and str(pmid).isdigit():
downloadfrompubmed(pmid, save_path)

🛠️ 自定义指南

更改研究主题

  1. 1. 编辑 dailyliteraturesearch.py 中的 SEARCH_KEYWORDS
  2. 更新类别名称和关键词
  3. 如有需要,修改目录结构

添加新类别

  1. 1. 创建新目录:papers/NEWCATEGORY/raw/
  2. 在 classifypaper() 函数中添加分类关键词
  3. 更新报告生成以包含新类别

集成通知系统

在检索完成后添加电子邮件/Slack/Discord通知:

python

在main()末尾


send_notification(f每日检索完成:找到 {results[total]} 篇论文)

📋 要求

Python依赖

bash
pip install requests

大多数其他模块为标准库

API访问(可选但推荐)

  • - Semantic Scholar API密钥:更高速率限制
  • OpenAlex API密钥:礼貌池访问
  • Unpaywall:免费,无需密钥(需要电子邮件)

设置环境变量:

bash
export SEMANTICSCHOLARAPI_KEY=your-key
export OPENALEXAPIKEY=your-key
export USER_EMAIL=your@email.com

⚠️ 重要说明

  1. 1. 速率限制:遵守API速率限制,尤其在没有API密钥的情况下
  2. 存储:监控下载PDF的磁盘空间
  3. 版权:仅下载开放获取或合法可用的论文
  4. 电子邮件:设置 USER_EMAIL 以实现礼貌API访问

🔄 版本历史

  • - 1.0.0(2026-03-18):初始版本
- 多源检索(PubMed、OpenAlex、Semantic Scholar) - 自动去重(批次 + 库) - 开放获取检测和下载 - 智能分类 - 带统计信息的每日报告

🤝 贡献

要贡献改进:

  1. 1. Fork该技能仓库
  2. 使用您自己的文献检索测试更改
  3. 提交包含改进描述的拉取请求

📄 许可证

本技能按原样提供,用于学术研究目的。用户有责任遵守出版商条款和版权法。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 daily-literature-search-1776206403 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 daily-literature-search-1776206403 技能

通过命令行安装

skillhub install daily-literature-search-1776206403

下载

⬇ 下载 daily-literature v1.0.0(免费)

文件大小: 27.81 KB | 发布时间: 2026-4-17 14:34

v1.0.0 最新 2026-4-17 14:34
Automated daily literature search for academic researchers—initial release.

- Searches PubMed, OpenAlex, and Semantic Scholar with configurable keywords
- Automatic deduplication by DOI (within batch and against local library)
- Detects and downloads open-access papers, using Unpaywall and PubMed Central integration
- Smart, configurable topic categorization for collected papers
- Generates daily Markdown reports and logs
- Includes upload analyzer for organizing manually added papers

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部