wewe-rss WeChat Export
适配 wewe-rss 的公众号抓取与文档导出工具。
它做什么
这个 skill 用于把符合 wewe-rss / JSON Feed 风格的公众号 feed 批量导出为清洗后的 Word 文档,并按需要生成 zip 交付包。
核心能力:
- - 分页抓取 feed
- 清洗公众号文章正文
- 过滤脚本、样式和页面级垃圾标签
- 图片本地化
- Pandoc 转 DOCX
- 生成
index.txt 汇总 - 可选打包为 zip
适用场景
当用户想做这些事情时使用本 skill:
- - 导出微信公众号文章为 DOCX
- 把 wewe-rss feed 做成可交付文档包
- 给导出文件自动加日期前缀
- 批量抓取公众号文章并打包
- 保留 HTML / Markdown / DOCX 作为验收产物
执行原则
- 1. 统一通过
scripts/run-export-feed.sh 调用。 - 不在 skill 内重复实现导出逻辑。
- 默认交付参数优先选择:
-
--output-mode docx
-
--rename-mode dated
-
--zip
- 4. 导出前检查依赖:
node、pandoc、curl、python3。 - 若未指定输出目录,默认输出到当前工作目录下的
export/。 - INLINECODE10 最大限制为
5,避免过度抓取。
参数格式
CODEBLOCK0
位置参数
- -
feed_url:必填,公众号 / wewe-rss feed JSON 地址 - INLINECODE13 :可选,默认 INLINECODE14
- INLINECODE15 :可选,默认落到当前工作目录 INLINECODE16
可选项
- -
--batch-size N:分页批大小,默认 2,最大 INLINECODE19 - INLINECODE20
-
docx:仅保留适合交付的 DOCX 结果
-
full:保留 HTML / Markdown / DOCX 与资源目录
-
dated:
YYYY-MM-DD-序号-标题.docx
-
plain:
序号-标题.docx
推荐用法
最终交付型导出
CODEBLOCK1
小样本验收
CODEBLOCK2
输出约定
成功后,至少返回:
- - INLINECODE29
- INLINECODE30
- INLINECODE31 (如果启用了
--zip) - INLINECODE33
- INLINECODE34
目录结构
CODEBLOCK3
wewe-rss 微信公众号导出
适配 wewe-rss 的公众号抓取与文档导出工具。
功能说明
本技能用于将符合 wewe-rss / JSON Feed 格式的公众号 feed 批量导出为清洗后的 Word 文档,并按需生成 zip 交付包。
核心能力:
- - 分页抓取 feed
- 清洗公众号文章正文
- 过滤脚本、样式和页面级垃圾标签
- 图片本地化
- Pandoc 转 DOCX
- 生成 index.txt 汇总
- 可选打包为 zip
适用场景
当用户需要执行以下操作时使用本技能:
- - 导出微信公众号文章为 DOCX
- 将 wewe-rss feed 制作成可交付文档包
- 为导出文件自动添加日期前缀
- 批量抓取公众号文章并打包
- 保留 HTML / Markdown / DOCX 作为验收产物
执行原则
- 1. 统一通过 scripts/run-export-feed.sh 调用。
- 不在技能内重复实现导出逻辑。
- 默认交付参数优先选择:
- --output-mode docx
- --rename-mode dated
- --zip
- 4. 导出前检查依赖:node、pandoc、curl、python3。
- 若未指定输出目录,默认输出到当前工作目录下的 export/。
- --batch-size 最大限制为 5,避免过度抓取。
参数格式
text
bash dir>/scripts/run-export-feed.sh url> [count] [output_dir] [--batch-size N] [--output-mode docx|full] [--rename-mode dated|plain] [--zip]
位置参数
- - feedurl:必填,公众号 / wewe-rss feed JSON 地址
- count:可选,默认 100
- outputdir:可选,默认输出到当前工作目录 export/
可选参数
- - --batch-size N:分页批大小,默认 2,最大 5
- --output-mode docx|full
- docx:仅保留适合交付的 DOCX 结果
- full:保留 HTML / Markdown / DOCX 与资源目录
- - --rename-mode dated|plain
- dated:YYYY-MM-DD-序号-标题.docx
- plain:序号-标题.docx
推荐用法
最终交付型导出
bash
bash /scripts/run-export-feed.sh \
https://example.com/feed.json \
100 \
./export/my-feed \
--batch-size 5 \
--output-mode docx \
--rename-mode dated \
--zip
小样本验收
bash
bash /scripts/run-export-feed.sh \
https://example.com/feed.json \
5 \
./export/my-feed-smoke \
--batch-size 1 \
--output-mode full \
--rename-mode dated
输出约定
成功后,至少返回:
- - outputdir
- indexpath
- zippath(如果启用了 --zip)
- outputmode
- rename_mode
目录结构
text
wewe-rss-wechat-export/
├── CHANGELOG.md
├── INSTALL.md
├── LICENSE
├── README.md
├── SKILL.md
├── _meta.json
├── manifest.yaml
└── scripts/
├── export-feed-single-pages.mjs
└── run-export-feed.sh