智能爬虫工具 - 企业级数据采集与反爬虫处理 | Smart Web Crawler - Enterprise data collection with anti-detection
企业级数据采集解决方案,支持智能反爬虫处理、分布式爬取和数据清洗。
| 功能模块 | 说明 |
|---|---|
| 智能爬虫引擎 | 基于 Playwright/Selenium 的动态渲染爬取 |
| 反爬虫处理 |
python
from scripts.crawler_engine import CrawlerEngine
bash
pip install -r requirements.txt
playwright install
smart-crawler/
├── SKILL.md # Skill说明文档
├── README.md # 完整文档
├── requirements.txt # 依赖列表
├── scripts/ # 核心模块
│ ├── crawler_engine.py # 爬虫引擎
│ ├── proxy_manager.py # 代理管理器
│ ├── data_extractor.py # 数据提取器
│ └── anti_detection.py # 反检测模块
├── examples/ # 使用示例
│ └── basic_usage.py
└── tests/ # 单元测试
└── test_crawler.py
bash
cd tests
python test_crawler.py
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 smart-crawler-1776189856 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-crawler-1776189856 技能
skillhub install smart-crawler-1776189856
文件大小: 12.21 KB | 发布时间: 2026-4-17 16:11