爬取知乎问题和回答。当用户要求爬取知乎、抓取知乎数据、搜索知乎问答,或提到"知乎"+"爬虫/爬取/抓取/搜索"时使用此技能。支持按关键词搜索问题、按回答数排序、抓取全部回答并保存为JSON和纯文本。
浏览器打开 zhihu.com 登录 → F12 → Network → 任意请求 → Request Headers → 复制 cookie: 后的完整值
bash
python zhihu_crawl.py \
--cookie 用户的Cookie \
--keywords 关键词1 关键词2 \
--top 100 \
--output ./zhihu_output
Windows PowerShell:
powershell
python zhihu_crawl.py
--cookie 用户的Cookie
--keywords 关键词1 关键词2
--top 100
--output ./zhihu_output
Windows 上若提示 SSL 错误,在命令前加:
$env:PATH = C:\python\anaconda\Library\bin; + $env:PATH
| 参数 | 必填 | 默认值 | 说明 |
|---|---|---|---|
| --cookie | 是 | — | 知乎登录 Cookie |
| --keywords |
output/
├── question_{id}.json # 每道题的完整数据(含全部回答)
├── questionlist.json # 问题列表(按回答数降序)
└── mergedall.txt # 所有内容合并纯文本(可直接喂给 AI 分析)
| 错误 | 原因 | 解决 |
|---|---|---|
| SSL module not available | Anaconda PATH 未配置 | 设置 $env:PATH = C:\python\anaconda\Library\bin; + $env:PATH |
| ModuleNotFoundError: requests |
抓取单主题:
bash
python zhihucrawl.py --cookie abc... --keywords 高松灯 --top 50 --output ./output灯
抓取多主题,取 TOP 200:
bash
python zhihu_crawl.py --cookie abc... --keywords MyGO Ave Mujica 丰川祥子 --top 200
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 zhihu-keyword-content-search-1775886314 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 zhihu-keyword-content-search-1775886314 技能
skillhub install zhihu-keyword-content-search-1775886314
文件大小: 6.68 KB | 发布时间: 2026-4-12 12:05