网络搜索与信息提取统一入口。整合 content-extraction、Jina Reader、Firecrawl、web-access CDP。自动选最经济工具链。可被 BMW(brand-marketing-workflow)、wealth 子代理等直接调用。
本技能是路由层,不重写任何已有工具。调度链:
web-intel
├── content-extraction/scripts/extract_router.py (URL 分类)
├── r.jina.ai (轻量全文提取)
├── firecrawl CLI (搜索 + 抓取)
└── web-access CDP Proxy (localhost:3456) (登录态/反爬)
| 模式 | 场景 | Token 消耗 | 延迟 |
|---|---|---|---|
| fast | 只需标题+摘要,快速定位 | ~200-500 | <2s |
| standard |
[fast] firecrawl search query --limit 5
→ 返回 title + url + snippet
[standard] firecrawl search + Jina 提取 top-1 全文
→ tool: firecrawl_search+jina
[deep] firecrawl search --scrape --limit 5
→ 反爬/登录页面可升级到 web-access CDP
Step 0: extract_router.py 判断 URL 类型
→ 微信/飞书/YouTube → 委托 skills/content-extraction(专用 handler)
→ 通用网页 → 继续
[fast] curl https://r.jina.ai/
[standard] Jina 优先;失败 → firecrawl scrape
[deep] web-access CDP(localhost:3456)优先;降级 Jina → firecrawl scrape
fast: firecrawl search $TICKER 财报/行情/股价 --limit 5
standard: 同 fast + Jina 提取 top-1(东方财富/雪球)
deep: → skills/stock-research-engine(完整基本面分析)
fast: firecrawl search 品牌名 营销/产品/用户反馈 --limit 5
standard: fast + Jina 提取各结果全文
deep: firecrawl search --scrape;需要 CDP 的站点走 web-access
bash
标准输出(JSON stdout):
json
{
query: ...,
mode: fast,
type: finance,
toolused: firecrawlsearch,
results: [{title: ..., url: ..., snippet: ...}],
full_content: null,
webaccessavailable: true,
latency_ms: 1200
}
web-access 通过 CDP Proxy(localhost:3456)直连用户 Chrome,天然携带登录态。
启动 CDP Proxy(deep 模式前置):
bash
bash ~/.openclaw/workspace/skills/web-access/scripts/check-deps.sh
web-intel 在 deep 模式下自动检测 CDP 可用性(webaccessavailable 字段)。CDP 可用时优先用于提取;不可用时降级到 Jina/Firecrawl。
| 需求 | 使用技能 |
|---|---|
| 微信公众号提取 | skills/content-extraction(handler=browser) |
| 飞书文档提取 |
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 web-intel-1775935520 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 web-intel-1775935520 技能
skillhub install web-intel-1775935520
文件大小: 5.96 KB | 发布时间: 2026-4-12 11:55