返回顶部
m

mrscraperMrScraper爬虫

Run AI-powered, unblockable web scraping, data extraction with natural language via the MrScraper API

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.4
安全检测
已通过
643
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

mrscraper

MrScraper

通过MrScraper API运行AI驱动的、不可屏蔽的网页抓取和数据提取,支持自然语言操作。

操作

该技能支持:

  • - 通过解锁器(隐身浏览器 + IP轮换)打开被屏蔽的页面
  • 根据自然语言指令启动AI抓取器运行
  • 在一个或多个URL上重新运行现有的抓取器配置
  • 运行基于手动工作流的重新运行
  • 按ID获取分页结果和详细结果

此技能仅限API使用,不依赖捆绑的本地脚本。

基础URL

  • - 解锁器API:https://api.mrscraper.com
  • 平台API:https://api.app.mrscraper.com

认证

解锁器API认证

在解锁器端点上使用查询参数认证:

  • - token=APITOKEN>

平台API认证

在平台端点上使用基于头的认证:

http
x-api-token: APITOKEN>
accept: application/json
content-type: application/json

如何获取MRSCRAPERAPITOKEN?

API令牌允许您的应用程序安全地与MrScraper API交互,并重新运行在仪表板中创建的抓取器。

请按照以下步骤在仪表板中操作:

  1. 1. 点击右上角的用户资料
  2. 选择API令牌
  3. 点击新建令牌
  4. 输入名称并设置过期日期
  5. 点击创建
  6. 复制新令牌并安全存储为MRSCRAPERAPITOKEN。
  7. 通过x-api-token头在请求中使用它。

安全规则:

  • - 切勿在客户端代码(浏览器/移动应用包)中暴露令牌。
  • 将令牌存储在环境变量或服务器端密钥管理器中。

来自认证文档的说明:

  • - API密钥适用于所有V3平台端点。
  • 同一密钥可用于sync.scraper.mrscraper.com上的端点。
  • 如需访问其他主机上的端点,请联系support@mrscraper.com。

安装和运行时

  • - 此技能文档不需要本地安装步骤。
  • 不需要捆绑的scripts/目录。
  • 调用是对上述两个基础URL的直接HTTPS请求。

数据和范围

  • - 数据仅发送到api.app.mrscraper.com和api.mrscraper.com。
  • 响应可能包含提取的页面内容和抓取元数据。
  • 此技能不定义隐藏的持久化或后台任务。
  • 切勿在日志、提交或输出中暴露令牌。

端点

1. 解锁器

  • - 方法:GET
  • URL:https://api.mrscraper.com
  • 认证:token查询参数

通过隐身浏览和IP轮换打开目标URL,然后返回HTML。当直接访问被验证码或反机器人保护阻止时使用此功能。

查询参数:

字段类型必需默认值描述
tokenstring解锁器令牌(MRSCRAPERAPITOKEN)
url
string | 是 | — | URL编码的目标URL | | timeout | number | 否 | 60 | 最大等待时间(秒,例如120) | | geoCode | string | 否 | 无 | 地理路由代码(例如SG) | | blockResources | boolean | 否 | false | 阻止非必要资源 |

请求示例:

bash
curl --location https://api.mrscraper.com?token=APITOKEN>&timeout=120&geoCode=SG&url=https%3A%2F%2Fwww.lazada.sg%2Fproducts%2Fpdp-i111650098-s23209659764.html&blockResources=false

响应示例:

html


...
...

说明:

  • - 建议明确指定geoCode和实际的超时时间,以获得可重复的行为。
  • 仅在需要会话特定内容时传递cookie。

2. 创建AI抓取器

  • - 方法:POST
  • 主机:https://api.app.mrscraper.com
  • 路径:/api/v1/scrapers-ai
  • 认证:x-api-token

根据自然语言指令创建新的AI抓取器运行。

负载参数(适用于agent:general或agent:listing):

字段类型必需默认值描述
urlstring目标URL
message
string | 是 | — | 提取指令 | | agent | string | 否 | general | 用于抓取的AI代理类型:general、listing或map | | proxyCountry | string | 否 | 无 | 基于代理的抓取的ISO国家代码 |

负载参数(适用于agent:map):

字段类型必需默认值描述
urlstring目标URL
agent
string | 否 | map | 用于抓取的AI代理类型(此情况下为map) | | maxDepth | number | 否 | 2 | 从起始URL爬取链接的最大深度级别。
0 = 仅起始URL,1 = +直接链接 | | maxPages | number | 否 | 50 | 爬取过程中要抓取的最大页面数。 | | limit | number | 否 | 1000 | 跨所有页面提取的最大数据记录数。达到此限制时停止抓取。 | | includePatterns | string | 否 | | 要包含的正则表达式模式(多个用\|\|分隔) | | excludePatterns | string | 否 | | 要排除的正则表达式模式(多个用\|\|分隔) |

请求示例:

bash
curl -X POST https://api.app.mrscraper.com/api/v1/scrapers-ai \
-H x-api-token: APITOKEN> \
-H Content-Type: application/json \
-d {
url: https://books.toscrape.com/catalogue/a-light-in-the-attic_1000/index.html,
message: 提取标题、价格、库存和评分,
agent: general
}

响应示例:

json
{
id: 497f6eca-6276-4993-bfeb-53cbbbba6f08,
createdAt: 2019-08-24T14:15:22Z,
createdById: e13e432a-5323-4484-a91d-b5969bc564d9,
updatedAt: 2019-08-24T14:15:22Z,
updatedById: d8bc6076-4141-4a88-80b9-0eb31643066f,
deletedAt: 2019-08-24T14:15:22Z,
deletedById: 8ef578ad-7f1e-4656-b48b-b1b4a9aaa1cb,
userId: 2c4a230c-5085-4924-a3e1-25fb4fc5965b,
scraperId: 6695bf87-aaa6-46b0-b1ee-88586b222b0b,
type: AI,
url: http://example.com,
status: 已完成,
error: string,
tokenUsage: 0,
runtime: 0,
data: {}, // 主要抓取数据
htmlPath: string,
recordingPath: string,
screenshotPath: string,
dataPath: string
}

说明:

  • - 正确选择代理类型,因为每个代理专门用于特定用例。对于

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 mrscraper-1776420088 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 mrscraper-1776420088 技能

通过命令行安装

skillhub install mrscraper-1776420088

下载

⬇ 下载 mrscraper v1.0.4(免费)

文件大小: 5.92 KB | 发布时间: 2026-4-17 18:11

v1.0.4 最新 2026-4-17 18:11
- Added Bulk Rerun Manual Scraper

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部