返回顶部
w

web-search-scraper-api-skill 网页抓取转Markdown

This skill helps users automatically extract complete Markdown content from any website via the BrowserAct Web Search Scraper API. The Agent should proactively apply this skill when users express needs like extract complete markdown from a specific website, scrape the content of an article link, get the text from a target url, convert a webpage to markdown format, fetch the main content of a blog post, extract data from a given web page, parse the html of a website into markdown, download the re

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
151
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

web-search-scraper-api-skill

Web Search Scraper API 技能

📖 简介

本技能通过 BrowserAct Web Search Scraper API 模板,为用户提供一站式网页内容提取服务。它能够直接从任意给定的 URL 中提取结构化的 Markdown 内容。只需输入目标 URL,即可获得干净可用的 Markdown 数据。

✨ 功能特性

  1. 1. 无幻觉,确保数据提取稳定精准:预设工作流避免了 AI 生成式幻觉。
  2. 无人机验证问题:无需处理 reCAPTCHA 或其他验证挑战。
  3. 无 IP 访问限制或地理围栏:无需处理区域 IP 限制。
  4. 执行速度更敏捷:相比纯 AI 驱动的浏览器自动化方案,任务执行更快。
  5. 性价比极高:相比消耗大量 Token 的 AI 方案,可大幅降低数据获取成本。

🔑 API Key 引导流程

运行前,必须检查 BROWSERACTAPIKEY 环境变量。如果未设置,请先不要执行其他操作,应询问并等待用户配合提供。 此时 Agent 必须告知用户

由于您尚未配置 BrowserAct API Key,请先前往 BrowserAct 控制台 获取您的 Key。

🛠️ 输入参数详情

Agent 在调用脚本时,应根据用户需求灵活配置以下参数:
  1. 1. target_url
- 类型:string - 描述:要提取内容的网站 URL。支持任何 HTTP/HTTPS URL。 - 示例:https://www.browseract.com

🚀 调用方式(推荐)

Agent 应执行以下独立脚本,实现一键获取结果:

bash

示例调用


python -u ./scripts/websearchscraperapi.py targeturl

⏳ 执行状态监控

由于任务涉及自动化浏览器操作,可能需要较长时间(数分钟)。脚本在运行时会持续输出带时间戳的状态日志(例如 [14:30:05] 任务状态:运行中)。 Agent 注意事项
  • - 在等待脚本返回结果期间,请持续关注终端输出。
  • 只要终端仍在输出新的状态日志,即表示任务正常运行。请勿误判为死锁或无响应。
  • 如果状态长时间未变化,或脚本停止输出且未返回结果,可触发重试机制。

📊 数据输出说明

执行成功后,脚本将直接从 API 响应中解析并打印结果。结果包含:
  • - content:网页的完整 Markdown 内容。

⚠️ 错误处理与重试机制

脚本执行过程中,如果发生错误(如网络波动或任务失败),Agent 应遵循以下逻辑:
  1. 1. 检查输出内容
- 如果输出包含 Invalid authorization,表示 API Key 无效或已过期。此时不要重试,应引导用户重新检查并提供正确的 API Key。 - 如果输出不包含 Invalid authorization,但任务执行失败(例如输出以 Error: 开头或返回结果为空),Agent 应自动尝试重新执行脚本一次
  1. 2. 重试限制
- 自动重试仅限一次。如果第二次尝试仍然失败,请停止重试并向用户报告具体的错误信息。

🌟 典型使用场景

  1. 1. 文章提取:将新闻文章链接的主要内容抓取为 Markdown。
  2. 博客文章解析:下载目标博客文章 URL 的可读文本。
  3. 网页转 Markdown:将任意给定的网站 URL 转换为干净的 Markdown 格式。
  4. 文档抓取:获取教程或文档页面的内容,用于离线阅读。
  5. 内容监控:自动提取特定网页的文本以检查更新。
  6. 数据处理:解析任意 HTTP/HTTPS URL 的 HTML,以结构化其内容。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 web-search-scraper-api-skill-1776122128 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 web-search-scraper-api-skill-1776122128 技能

通过命令行安装

skillhub install web-search-scraper-api-skill-1776122128

下载

⬇ 下载 web-search-scraper-api-skill v1.0.0(免费)

文件大小: 4.56 KB | 发布时间: 2026-4-14 10:15

v1.0.0 最新 2026-4-14 10:15
- Initial release of the Web Search Scraper API Skill.
- Enables automatic extraction of complete markdown content from any website via BrowserAct API.
- Offers guidance for API key setup and error handling.
- Includes clear input parameter and usage instructions.
- Implements execution status monitoring and retry logic for robust data extraction.
- Supports diverse use cases such as article scraping, documentation fetching, and webpage-to-markdown conversion.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部