返回顶部
s

smart-web-fetch智能网页抓取

智能网页抓取技能 - 替代内置 web_fetch,自动使用 Jina Reader / markdown.new / defuddle.md 清洗服务获取干净 Markdown。支持多级降级策略,大幅降低 Token 消耗。当 Agent 需要获取网页内容时使用本技能替代 web_fetch。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
3,650
下载量
免费
免费
25
收藏
概述
安装方式
版本历史

smart-web-fetch

Smart Web Fetch

智能网页内容获取技能,完全替代 web_fetch,自动通过清洗服务获取干净 Markdown。

核心功能

  • - 完全替代 web_fetch: 获取的已经是清洗后的 Markdown,而非原始 HTML
  • 四级降级策略: Jina → markdown.new → defuddle.md → 原始内容
  • Token 优化: 清洗后的内容比原始 HTML 节省 50-80% Token

使用方式

命令行获取网页内容

bash

获取清洗后的 Markdown(文本输出)


python3 {baseDir}/scripts/fetch.py https://example.com/article

获取 JSON 格式(包含元信息)

python3 {baseDir}/scripts/fetch.py https://example.com/article --json

在 Agent 中使用

当用户需要获取网页内容时:

用户: 帮我查一下 https://example.com/article 的内容

Agent 应该:

  1. 1. 运行: python3 ~/.openclaw/skills/smart-web-fetch/scripts/fetch.py https://example.com/article
  2. 直接获得清洗后的 Markdown 内容

JSON 输出格式

json
{
success: true,
url: https://r.jina.ai/http://example.com/article,
content: # Article Title\n\nClean markdown content here...,
source: jina,
error: null
}

降级策略

  1. 1. Jina Reader (首选)
- URL: https://r.jina.ai/http://{target} - 免费,无需 API Key,中文支持好
  1. 2. markdown.new (降级)
- URL: https://markdown.new/{target}
  1. 3. defuddle.md (降级)
- URL: https://defuddle.md/{target}
  1. 4. 原始内容 (最终兜底)
- 直接获取原始 HTML

Agent 配置建议

为了强制使用本技能替代 web_fetch,在 openclaw.json 中配置:

json
{
agents: {
list: [
{
id: your-agent,
tools: {
deny: [web_fetch]
}
}
]
}
}

这样 Agent 就无法调用内置 web_fetch,只能通过本技能获取网页内容。

优势

  • - 🚀 Token 节省 50-80%: 去除广告、导航栏等噪音
  • 🔄 自动容错: 四级服务降级,确保可用性
  • 🆓 零成本: 全部使用免费服务
  • 🔌 即插即用: 不需要 API Key
  • 📝 干净输出: 纯 Markdown,无需额外解析

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 smart-web-fetch-1776270266 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-web-fetch-1776270266 技能

通过命令行安装

skillhub install smart-web-fetch-1776270266

下载

⬇ 下载 smart-web-fetch v1.0.0(免费)

文件大小: 4.49 KB | 发布时间: 2026-4-16 17:37

v1.0.0 最新 2026-4-16 17:37
Initial release - 智能网页抓取技能,支持 Jina/markdown.new/defuddle.md 多级降级

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部