Xiaohongshu Crawler
小红书(Xiaohongshu)内容爬取工具,支持搜索、笔记详情、用户信息等公开内容的获取。
📋 描述
小红书内容爬取工具,支持搜索笔记(需要登录)、获取笔记详情、用户信息、热门笔记等公开内容爬取功能。
使用场景:
- - 搜索特定关键词的笔记
- 获取单条笔记的详细内容
- 获取用户公开信息
- 获取热门笔记列表
- 批量深度爬取并生成分析报告
注意: 本工具仅限学习和研究使用,必须遵守小红书用户协议和相关法律法规。
🚀 安装
CODEBLOCK0
⚙️ 快速配置
1. 获取 Cookie(搜索功能必需)
CODEBLOCK1
按提示扫码登录后输入 save 即可。
2. 测试 Cookie
CODEBLOCK2
显示 "✅ Cookie 有效" 即可使用。
📝 核心用法
快速搜索
CODEBLOCK3
深度爬取
CODEBLOCK4
生成详细内容和 Markdown 分析报告。
其他功能
CODEBLOCK5
📚 详细文档
- - 完整使用指南 → INLINECODE1
- 使用示例 → INLINECODE2
- 故障排查 → INLINECODE3
🛠️ 脚本说明
| 脚本 | 功能 | 需要登录 |
|---|
| INLINECODE4 | 交互式获取 Cookie | - |
| INLINECODE5 |
测试 Cookie 有效性 | - |
|
quick-search.js | 快速搜索笔记 | ✅ |
|
deep-crawl.js | 深度爬取笔记详情 | ✅ |
|
get-note.js | 获取单条笔记详情 | ✅ |
|
get-user.js | 获取用户信息 | ✅ |
|
hot-notes.js | 获取热门笔记 | 可选 |
⚠️ 使用规范
合规使用
- - ✅ 允许: 个人学习研究、公开内容爬取、小批量数据(<50 条/次)
- ❌ 禁止: 商业用途、大规模高频爬取、私人内容、绕过付费、分发数据
反爬保护
- - 默认随机延迟 2-8 秒
- 每分钟最多 10 个请求
- 模拟人类浏览行为
详细配置和故障排查请查看
references/ 目录下的文档。
Xiaohongshu Crawler
小红书(Xiaohongshu)内容爬取工具,支持搜索、笔记详情、用户信息等公开内容的获取。
📋 描述
小红书内容爬取工具,支持搜索笔记(需要登录)、获取笔记详情、用户信息、热门笔记等公开内容爬取功能。
使用场景:
- - 搜索特定关键词的笔记
- 获取单条笔记的详细内容
- 获取用户公开信息
- 获取热门笔记列表
- 批量深度爬取并生成分析报告
注意: 本工具仅限学习和研究使用,必须遵守小红书用户协议和相关法律法规。
🚀 安装
bash
clawhub install xiaohongshu-crawler
⚙️ 快速配置
1. 获取 Cookie(搜索功能必需)
bash
node scripts/get-cookie.js
按提示扫码登录后输入 save 即可。
2. 测试 Cookie
bash
node scripts/test-cookie.js
显示 ✅ Cookie 有效 即可使用。
📝 核心用法
快速搜索
bash
node scripts/quick-search.js 关键词 [数量]
深度爬取
bash
node scripts/deep-crawl.js 关键词 [数量]
生成详细内容和 Markdown 分析报告。
其他功能
bash
node scripts/get-note.js 笔记 ID # 获取笔记详情
node scripts/get-user.js 用户 ID # 获取用户信息
node scripts/hot-notes.js # 获取热门笔记
📚 详细文档
- - 完整使用指南 → references/USAGE.md
- 使用示例 → references/examples.md
- 故障排查 → references/TROUBLESHOOTING.md
🛠️ 脚本说明
| 脚本 | 功能 | 需要登录 |
|---|
| get-cookie.js | 交互式获取 Cookie | - |
| test-cookie.js |
测试 Cookie 有效性 | - |
| quick-search.js | 快速搜索笔记 | ✅ |
| deep-crawl.js | 深度爬取笔记详情 | ✅ |
| get-note.js | 获取单条笔记详情 | ✅ |
| get-user.js | 获取用户信息 | ✅ |
| hot-notes.js | 获取热门笔记 | 可选 |
⚠️ 使用规范
合规使用
- - ✅ 允许: 个人学习研究、公开内容爬取、小批量数据(<50 条/次)
- ❌ 禁止: 商业用途、大规模高频爬取、私人内容、绕过付费、分发数据
反爬保护
- - 默认随机延迟 2-8 秒
- 每分钟最多 10 个请求
- 模拟人类浏览行为
详细配置和故障排查请查看 references/ 目录下的文档。