Daily English News - BBC新闻PDF生成器
抓取BBC News RSS,生成每日英语新闻PDF,包含完整文章、全文中文翻译和80个核心词汇。
使用方法
CODEBLOCK0
输出
- - PDF文件: INLINECODE0
- 包含4篇BBC News文章
PDF内容
每个PDF包含:
- - 标题:Daily English News
- 副标题:Miaosi English Team
- 日期:YYYY-MM-DD
- 4篇BBC News完整文章
- 每篇文章:英文原文 + 中文翻译 + 80个词汇(附中文翻译)
技术实现
- - requests-html: JavaScript渲染(抓取动态页面)
- BeautifulSoup: HTML解析
- fpdf2: PDF生成(支持中日韩文字体)
- Google翻译API: 实时翻译
文章来源
- - BBC News RSS: https://feeds.bbci.co.uk/news/rss.xml
- 每次抓取最新的4篇文章
更新日志
v6.8.0 (2026-03-27)
- - 修复特殊字符导致PDF编码错误
- 添加clean_text函数处理en-dash、em-dash、smart quotes等
v6.7 (2026-03-26)
- - 文件名更新为 "Miaosi Daily English News YYYY-MM-DD.pdf"
v6.6 (2026-03-26)
- - 添加"Miaosi English Team"副标题
v6.5 (2026-03-25)
v6.4 (2026-03-24)
- - 每篇文章80个词汇(不再只是KET词汇)
- 移除全文翻译部分
v6.3 (2026-03-23)
License
Apache License 2.0
Daily English News - BBC新闻PDF生成器
抓取BBC News RSS,生成每日英语新闻PDF,包含完整文章、全文中文翻译和80个核心词汇。
使用方法
bash
cd /root/.openclaw/workspace/skills/ket-news-fetcher
python3 ketnewspdf.py
输出
- - PDF文件:/root/.openclaw/workspace-explodegao/english-audio/Miaosi Daily English News YYYY-MM-DD.pdf
- 包含4篇BBC News文章
PDF内容
每个PDF包含:
- - 标题:Daily English News
- 副标题:Miaosi English Team
- 日期:YYYY-MM-DD
- 4篇BBC News完整文章
- 每篇文章:英文原文 + 中文翻译 + 80个词汇(附中文翻译)
技术实现
- - requests-html: JavaScript渲染(抓取动态页面)
- BeautifulSoup: HTML解析
- fpdf2: PDF生成(支持中日韩文字体)
- Google翻译API: 实时翻译
文章来源
- - BBC News RSS: https://feeds.bbci.co.uk/news/rss.xml
- 每次抓取最新的4篇文章
更新日志
v6.8.0 (2026-03-27)
- - 修复特殊字符导致PDF编码错误
- 添加clean_text函数处理en-dash、em-dash、smart quotes等
v6.7 (2026-03-26)
- - 文件名更新为 Miaosi Daily English News YYYY-MM-DD.pdf
v6.6 (2026-03-26)
- - 添加Miaosi English Team副标题
v6.5 (2026-03-25)
v6.4 (2026-03-24)
- - 每篇文章80个词汇(不再只是KET词汇)
- 移除全文翻译部分
v6.3 (2026-03-23)
License
Apache License 2.0