Weixin Article Reader
Use this skill when the user provides a mp.weixin.qq.com article URL and wants the raw article text, or when article content must be extracted before summarization.
Usage
Prefer the bundled script:
CODEBLOCK0
If the current working directory is not the skill root, first locate the installed weixin-article-reader skill directory and run scripts/extract_wechat_article.py from there.
The script returns JSON with:
- - INLINECODE3
- INLINECODE4
- INLINECODE5
- INLINECODE6
- INLINECODE7
Workflow
- 1. Detect a
mp.weixin.qq.com article URL. - Run the bundled extraction script.
- If the user wants the full article, return title, author, publish date, and body text.
- If the user wants a summary, first confirm the extracted
content is non-empty, then summarize it.
Response Guidance
- - For full-text requests, return the title, author, publish date, and then the article body.
- For summaries, summarize the extracted
content and include the title plus source URL. - If
publish_date is empty, do not invent a date. State that the page did not expose a publish date in a reliably parsed form.
Notes
- - Do not use
pip install. - Do not require
beautifulsoup4 or requests. - Prefer the bundled script instead of relying on unavailable generic web-extraction helpers.
- If the script returns empty content, explain that the article may use a special page structure or access restriction.
- This skill only applies to
mp.weixin.qq.com article pages. If the URL is from another domain, say the skill does not apply.
Weixin Article Reader
当用户提供 mp.weixin.qq.com 的文章链接并希望获取原始文章文本时,或需要在总结前提取文章内容时,使用此技能。
使用方法
优先使用捆绑脚本:
bash
python3 scripts/extractwechatarticle.py https://mp.weixin.qq.com/s/xxxx
如果当前工作目录不是技能根目录,请先找到已安装的 weixin-article-reader 技能目录,然后在该目录下运行 scripts/extractwechatarticle.py。
脚本返回 JSON 格式数据,包含:
- - title(标题)
- author(作者)
- publishdate(发布日期)
- content(内容)
- sourceurl(来源链接)
工作流程
- 1. 检测是否为 mp.weixin.qq.com 的文章链接。
- 运行捆绑的提取脚本。
- 如果用户需要完整文章,返回标题、作者、发布日期和正文。
- 如果用户需要摘要,先确认提取的 content 不为空,然后进行总结。
回复指南
- - 对于全文请求,返回标题、作者、发布日期,然后是文章正文。
- 对于摘要请求,总结提取的 content,并包含标题和来源链接。
- 如果 publish_date 为空,不要编造日期。应说明页面未以可可靠解析的形式提供发布日期。
注意事项
- - 不要使用 pip install。
- 不需要 beautifulsoup4 或 requests。
- 优先使用捆绑脚本,而非依赖不可用的通用网页提取工具。
- 如果脚本返回空内容,需说明该文章可能使用了特殊的页面结构或存在访问限制。
- 此技能仅适用于 mp.weixin.qq.com 的文章页面。如果链接来自其他域名,需说明该技能不适用。