返回顶部
c

content-alchemy内容炼金术

Turn articles, web pages, PDFs, and excerpts into structured notes, key insights, practical actions, and reusable takeaways.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
101
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

content-alchemy

内容炼金术

技能目的

使用此技能将阅读输入转化为可复用的个人成果,而非简单的摘要。

支持的输入类型:

  • - 文章正文
  • 网页链接
  • 提取的网页文本
  • PDF文件
  • 书籍摘录
  • 长篇解释性段落

预期输出形式:

  • - 结构化笔记
  • 核心见解
  • 可执行的后续步骤
  • 可复用的收获

使用时机

当用户提出类似以下需求时,优先使用此技能:

  • - 把这篇文章变成我能保留的东西
  • 从这个页面提取有用的收获
  • 把这个PDF变成笔记和行动项
  • 帮我继续阅读这个长PDF
  • 总结这个内容,但要让它比普通摘要更有用

区分规则

始终遵循以下规则:

  1. 1. 不要将任务视为单纯的摘要。
  2. 重构价值、结构和实用性,而非仅仅压缩内容。
  3. 输出应感觉像保存的个人成果,而非模型的转述。
  4. 每个结果应至少改善以下一项:
- 更易于回顾 - 更易于记忆 - 更易于行动 - 更易于复用
  1. 5. 如果结果读起来仍像通用摘要,则重新构建。

范围与限制

本版本支持三种输入路径:

  • - plaintext(纯文本)
  • weburl(网页链接)
  • pdf_file(PDF文件)

本版本不直接处理:

  • - 扫描版PDF的OCR识别
  • 代码分析工作流
  • 纯表格优先的分析
  • 碎片化、以图片为主且可读文本较少的输入

如果文本提取失败或文本质量过低,需明确说明情况并建议使用OCR或提供源文本。

脚本规则

运行捆绑脚本时:

  • - 始终使用 python3
  • 优先使用已安装技能目录的绝对路径
  • 不要假设当前工作目录就是技能目录

推荐配置:

bash
SKILL_ROOT=$HOME/.claude/skills/content-alchemy

内容转换由模型直接执行。

  • - 不存在 processcontentalchemy.py 脚本。
  • 不要虚构隐藏的处理脚本。
  • 如需固定输出结构,请使用:
- templates/result_template.md - templates/checkpoint_template.md

输入路径A:纯文本

适用于以下输入:

  • - 文章正文
  • 提取的网页内容
  • 摘录
  • 长篇解释性文本

直接在模型中使用面向结果的输出结构进行处理。

输入路径B:网页链接

当输入为链接时:

  1. 1. 运行 extractwebtext.py
  2. 提取标题、网站、作者、发布时间和正文
  3. 检查提取结果是否足够支持转换
  4. 如不足,说明限制并请求提供源文本

命令:

bash
python3 $SKILLROOT/scripts/extractweb_text.py https://example.com/article

仅用于故障排查:

bash
python3 $SKILLROOT/scripts/extractweb_text.py https://example.com/article --insecure

输入路径C:PDF文件

当输入为PDF时:

  1. 1. 运行 planpdfreading.py
  2. 根据页数和文本质量确定策略
  3. 使用 extractpdftext.py 提取相应页码范围
  4. 对于较长的PDF,初始化或恢复状态并逐段处理

规划命令:

bash
python3 $SKILLROOT/scripts/planpdf_reading.py /path/to/file.pdf

规划结果返回:

  • - sessionroot(会话根目录)
  • planfile(规划文件)
  • statefile(状态文件)
  • commands(命令)
  • segmentresultsdir(分段结果目录)
  • checkpointresults_dir(检查点结果目录)

优先使用返回的确切路径和命令,而非猜测文件名。

提取页码范围:

bash
python3 $SKILLROOT/scripts/extractpdf_text.py /path/to/file.pdf --page-start 1 --page-end 5

初始化或恢复状态:

bash
python3 $SKILLROOT/scripts/updatepdfsessionstate.py init --plan-file <返回的planfile> --state-file <返回的statefile>

仅在用户明确要求重新开始时强制重置:

bash
python3 $SKILLROOT/scripts/updatepdfsessionstate.py init --plan-file <返回的planfile> --state-file <返回的statefile> --force-reset

移动到下一段:

bash
python3 $SKILLROOT/scripts/updatepdfsessionstate.py next --state-file <返回的state_file>

保存当前分段结果:

bash
python3 $SKILLROOT/scripts/recordpdfsegmentresult.py --state-file <返回的state_file> --content-file /path/to/segment-result.md

构建下一个检查点包:

bash
python3 $SKILLROOT/scripts/buildpdfcheckpoint.py --state-file <返回的statefile>

保存检查点摘要:

bash
python3 $SKILLROOT/scripts/recordpdfcheckpoint.py --state-file <返回的statefile> --content-file /path/to/checkpoint-summary.md

显示会话进度:

bash
python3 $SKILLROOT/scripts/summarizepdfsession.py --state-file <返回的statefile>

查找最近保存的PDF会话:

bash
python3 $SKILLROOT/scripts/findrecentpdfsession.py

PDF路径规则

按页数的默认路径:

  • - 1-40 页 -> singlepass(单次通读)
  • 41-150 页 -> segmentedread(分段阅读)
  • 151-400 页 -> longformread(长文阅读)
  • 401+ 页 -> book_mode(书籍模式)

如果多次窗口采样仍报告 lowtextpdf = true,则将该PDF视为可能为扫描版、基于图片或低质量文本。

会话状态规则

对于 segmentedread、longformread 和 bookmode:

  1. 1. 在首次阅读步骤前初始化状态。
  2. 继续前先读取状态。
  3. 在执行上一步/下一步/跳转操作前更新状态。
  4. 在新会话中不要仅依赖聊天记忆。
  5. 如果状态丢失,重新规划或重新初始化,而非假装存在进度。
  6. 尽可能优先使用规划结果返回的命令。
  7. 默认恢复已保存的进度,除非用户明确要求重新开始。
  8. 立即保存每个已完成的分段结果。
  9. 在编写检查点摘要前先构建检查点源材料。

现有会话行为

如果 planpdfreading.py 返回 existing_session(现有会话):

  1. 1. 继续下一段应恢复状态然后向前推进。
  2. 从上次位置继续应恢复状态并读取当前段,但不推进。
  3. 我在哪里?或阅读状态应调用 summarizepdfsession.py。
  4. 仅在用户明确要求从头重新开始时使用 --force-reset。

在状态摘要中,清晰区分:

  • - 已完成的总分段数
  • 从头开始的连续完成情况
  • 最早未完成的检查点窗口

输出结构

默认分段结果应使用以下结构:

  1. 1. 来源信息
  2. 内容主题
  3. 三个核心观点
  4. 重构的结构
  5. 关键见解
  6. 可执行的后续步骤
  7. 可复用的收获

检查点结构:

  1. 1. 阶段范围
  2. 阶段主题
  3. 核心发现
  4. 重构的结构
  5. 关键见解
  6. 后续行动或阅读指导
  7. 可复用的检查点收获

写作规则

  • - 模型直接执行转换。
  • 先将结果内容写入临时markdown文件。
  • 然后调用正确的记录脚本将其保存到官方会话结构中。
  • 除非出于调试目的有意绕过记录脚本,否则不要手动编写最终的 segment-XXX.md 或 checkpoint-XXX.md 文件。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 content-alchemy-1776015508 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 content-alchemy-1776015508 技能

通过命令行安装

skillhub install content-alchemy-1776015508

下载

⬇ 下载 content-alchemy v1.0.0(免费)

文件大小: 41.89 KB | 发布时间: 2026-4-13 09:51

v1.0.0 最新 2026-4-13 09:51
Initial release of the Content Alchemy skill.

- Transform articles, web pages, and PDFs into structured notes, insights, and actionable takeaways, going beyond plain summarization.
- Supports three input types: plain text, web URLs, and PDF files, each with dedicated processing routes.
- Introduces PDF reading session management with state handling, segmented reading, and checkpointing for long documents.
- Provides clear instructions for handling text extraction failures and routing based on PDF page count.
- Ensures all outputs are structured for reuse, retention, and practical action, rather than generic summaries.
- English-source release published for both GitHub and ClawHub.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部