抖音图文笔记采集工具。搜索关键词 → 自动筛选「图文·一周内」→ Playwright 截图(绕过反爬虫)→ Baidu OCR 识别图片文字 → 输出 Markdown 报告(含热度评分)。当用户提到"抖音图文采集"、"抖音笔记抓取"、"抖音爬虫"、"抖音内容采集"等场景时加载此技能。
抖音图文笔记采集工具 —— 一条命令完成:搜索 → 筛选图文 → 截图 → OCR → Markdown 报告。
bash
pip install playwright requests python-dotenv
python -m playwright install chromium
在技能目录创建 .env:
BAIDUPADDLEOCRTOKEN=你的token
获取 Token:访问 百度 AI Studio,免费注册,每天 1 万次免费调用。
bash
python
浏览器打开抖音,扫码登录后关闭。登录状态自动保存,后续无需重复操作。
bash
| 参数 | 说明 | 默认值 |
|---|---|---|
| --keyword | 搜索关键词 | 必填 |
| --count |
报告保存至 output/notes{keyword}{timestamp}.md,图片保存至 data/images/。
每篇笔记包含:
douyin-scraper/
├── scripts/
│ ├── full_workflow.py # 主流水线
│ └── login.py # 登录脚本
├── data/
│ └── images/ # 截图
├── output/ # Markdown 报告
├── profile/ # 浏览器登录状态
└── .env # Token 配置
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 douyin-scraper-1776009741 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 douyin-scraper-1776009741 技能
skillhub install douyin-scraper-1776009741
文件大小: 14.45 KB | 发布时间: 2026-4-13 10:06