返回顶部
p

parallel-extract并行提取

URL content extraction via Parallel API. Extracts clean markdown from webpages, articles, PDFs, and JS-heavy sites. Use for reading specific URLs with LLM-ready output.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
1,833
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

parallel-extract

Parallel Extract

从URL中提取干净、可直接用于LLM的内容。支持网页、文章、PDF以及需要渲染的JavaScript密集型网站。

使用场景

当用户提出以下需求时触发此技能:

  • - 读取这个URL、获取这个页面、从...提取
  • 获取[URL]的内容
  • 这篇文章说了什么?
  • 读取PDF、JS密集型页面或付费内容
  • 从杂乱的网页中获取干净的Markdown格式内容

用搜索发现内容;用提取读取内容。

快速开始

bash
parallel-cli extract https://example.com/article --json

CLI参考

基本用法

bash
parallel-cli extract [options]

常用参数

参数说明
--url <url>要提取的URL(可重复,最多10个)
--objective <focus>
聚焦提取特定内容 | | --json | 输出为JSON格式 | | --excerpts / --no-excerpts | 包含相关摘录(默认:开启) | | --full-content / --no-full-content | 包含完整页面内容 | | --excerpts-max-chars N | 每条摘录最大字符数 | | --excerpts-max-total-chars N | 摘录总最大字符数 | | --full-max-chars N | 完整内容最大字符数 | | -o | 将输出保存到文件 |

示例

基础提取:
bash
parallel-cli extract https://example.com/article --json

聚焦提取:
bash
parallel-cli extract https://example.com/pricing \
--objective 定价层级和功能 \
--json

PDF完整内容:
bash
parallel-cli extract https://example.com/whitepaper.pdf \
--full-content \
--json

多个URL:
bash
parallel-cli extract \
--url https://example.com/page1 \
--url https://example.com/page2 \
--json

默认工作流程

  1. 1. 搜索:使用目标+关键词查询
  2. 检查:查看标题/URL/日期;选择最佳来源
  3. 提取:提取你需要的特定页面(前N个URL)
  4. 回答:使用提取的摘录/内容进行回答

最佳实践提示

目标设定

提取时提供上下文:
  • - 你正在寻找的具体信息
  • 为什么需要这些信息(有助于聚焦提取)

良好示例: --objective 查找安装步骤和系统要求

不佳示例: --objective 阅读页面

响应格式

返回结构化JSON,包含:

  • - url — 来源URL
  • title — 页面标题
  • excerpts[] — 相关文本摘录(如启用)
  • fullcontent — 完整页面内容(如启用)
  • publishdate — 发布日期(如有)

输出处理

将提取的内容转化为面向用户的回答时:

  • - 保持内容原样 — 不要进行不必要的改写
  • 完整提取所有列表项
  • 去除噪音:导航菜单、页脚、广告、点击这里链接
  • 保留所有事实、名称、数字、日期、引用
  • 包含URL + 发布日期以确保透明度

上下文不足?

对于长对话,保存结果并使用sessions_spawn:

bash
parallel-cli extract --json -o /tmp/extract-.json

然后生成子代理:
json
{
tool: sessions_spawn,
task: 读取 /tmp/extract-.json 并总结关键内容。,
label: extract-summary
}

错误处理

退出码含义
0成功
1
意外错误(网络、解析) | | 2 | 无效参数 | | 3 | API错误(非2xx状态码) |

前置条件

  1. 1. 在parallel.ai获取API密钥
  2. 安装CLI:

bash
curl -fsSL https://parallel.ai/install.sh | bash
export PARALLELAPIKEY=your-key

参考文档

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 parallel-extract-1776366338 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 parallel-extract-1776366338 技能

通过命令行安装

skillhub install parallel-extract-1776366338

下载

⬇ 下载 parallel-extract v1.0.0(免费)

文件大小: 2.34 KB | 发布时间: 2026-4-17 16:11

v1.0.0 最新 2026-4-17 16:11
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部