返回顶部
p

paper-ingest-normalizer文献标准化

Normalize papers, PDFs, URLs, and literature notes into structured research records for project memory and retrieval. Use when: (1) a new paper, PDF, DOI, or article enters the system, (2) literature format is inconsistent, (3) researcher needs standardized extraction, (4) project memory needs clean paper records. Triggered by requests like read this paper, ingest this PDF, normalize this literature, 整理这篇文献, or when raw literature needs to become structured project memory.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
93
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

paper-ingest-normalizer

论文输入标准化器

将原始文献输入转换为标准化记录,确保适用于项目记忆、论文数据库及下游综合处理流程。

输入

需提供以下其中一项:

  • - pdfpath — PDF文件的本地路径
  • url — 论文/文章链接
  • rawtext — 提取或粘贴的文本
  • metadata_blob — 现有元数据字典

此外还需提供:

  • - projectid — 任何回写操作必需
  • sourcetype — 可选值:pdf、doi、url、text、metadata
  • optional tags — 用于分类的字符串列表

输出结构

返回结构化对象:

title: string
authors: string[] | null
year: number | null
source: string # 期刊、会议、预印本等
doiorurl: string | null
project_id: string
paper_type: string # 实验性、理论性、综述等
material_system: string | null # 例如钙钛矿太阳能电池、石墨烯场效应管
device_type: string | null # 例如FTO/玻璃、柔性基底
key_variables: string[] | null # 研究的自变量
key_metrics: string[] | null # 测量结果(PCE、迁移率等)
core_findings: string # 2-3句中立总结
claimed_mechanism: string | null
limitations: string | null
normalized_summary: string # 1-2段结构化总结
uncertain_fields: string[] | null # 无法验证的字段
writeback_ready: boolean # 仅当关键标识字段存在时为true
writeback_payload: object # 要写入项目记忆的记录

规则

  1. 1. 没有projectid时绝不写入项目记忆。 如未提供则询问。
  2. 区分直接观察与声称的解释。 标注推断与直接提取。
  3. 保留不确定性。 缺失字段使用null;在uncertainfields中列出。
  4. 不虚构缺失的文献字段。 不凭空编造作者、年份等。
  5. 不过度声称。 确保corefindings和normalizedsummary基于文本实际内容。
  6. 绝不混淆摘要与发现。 摘要陈述意图;发现是数据支持的内容。
  7. 如果writeback_ready = false,明确列出缺失的字段及其原因。

PDF提取

对于PDF文件,在处理前使用summarize技能或pdfplumber/PyMuPDF提取文本。

工作流程

  1. 1. 识别来源类型 — 确定哪个输入字段已填充
  2. 提取原始内容 — PDF文本、URL内容或使用提供的原始文本
  3. 解析文献字段 — 标题、作者、年份、来源、DOI
  4. 识别研究内容 — 材料体系、器件类型、变量、指标
  5. 提炼发现 — 区分测量结果与声称内容
  6. 组装writebackpayload — 符合上述模式的结构化记录
  7. 评估完整性 — 根据关键标识字段的存在情况设置writebackready

失败处理

如果解析不完整:

  • - 返回部分结构化输出,包含所有成功提取的字段
  • 在uncertainfields中填入无法确定的字段列表
  • 当标题、作者或年份缺失时,设置writebackready = false

交叉参考

标准化后的综合处理,请参阅research技能中的论文综合工作流程。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 paper-ingest-normalizer-1775978708 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 paper-ingest-normalizer-1775978708 技能

通过命令行安装

skillhub install paper-ingest-normalizer-1775978708

下载

⬇ 下载 paper-ingest-normalizer v1.0.0(免费)

文件大小: 2.46 KB | 发布时间: 2026-4-13 11:24

v1.0.0 最新 2026-4-13 11:24
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部