返回顶部
g

gmail-link-archiverGmail链接归档器

>-

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.0
安全检测
已通过
106
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

gmail-link-archiver

Gmail 链接归档器

从邮件链接中归档网页内容。该技能通过 IMAP 连接到 Gmail,按主题前缀关键词筛选邮件,使用 Playwright(无头 Chromium)爬取每个链接,将页面转换为 Markdown,并保存到你的 OpenClaw 工作区。

快速开始

1. 安装依赖(一次性)

bash
bash references/setup.sh

这将自动安装:

  • - playwright(Python)+ Chromium 浏览器二进制文件
  • 用于 HTML→Markdown 转换的 html2text

2. 首次运行 — 交互式设置

bash
python3 references/gmaillinkarchiver.py

首次运行将提示你输入以下内容:

设置项描述默认值
IMAP 服务器Gmail IMAP 主机imap.gmail.com
IMAP 端口
SSL 端口 | 993 |
| Gmail 地址 | 你的完整邮箱地址 | — |
| 应用密码 | Gmail 应用密码(不是你的常规密码) | — |
| 默认邮箱 | 要搜索的 IMAP 文件夹 | INBOX |
| 主题前缀 | 筛选主题以此开头的邮件 | — |
| 工作区路径 | Markdown 文件的保存位置 | ~/openclaw-workspace/mail-archive |

凭据将保存在本地 ~/.config/gmail-link-archiver/config.json,权限为 0600。这些凭据绝不会被传输或记录

Gmail 应用密码:你需要在 https://myaccount.google.com/apppasswords 生成一个应用密码(需要开启两步验证)。

3. 后续运行

首次设置后,后续运行将从保存的配置中读取凭据:

bash

使用保存的配置默认值


python3 references/gmaillinkarchiver.py

临时覆盖邮箱和前缀

python3 references/gmaillinkarchiver.py --mailbox INBOX --subject-prefix [Newsletter]

保存到不同的工作区

python3 references/gmaillinkarchiver.py --workspace ~/my-archive

限制爬取链接数量

python3 references/gmaillinkarchiver.py --max-links 10

重新运行设置向导

python3 references/gmaillinkarchiver.py --reconfigure

工作原理

  1. 1. 连接 — 通过 IMAP SSL 认证到 Gmail
  2. 筛选 — 在指定邮箱中搜索匹配主题前缀的邮件
  3. 提取 — 解析邮件正文(HTML + 纯文本)以查找 HTTP/HTTPS 链接
  4. 爬取 — 通过 Playwright 在无头 Chromium 中打开每个链接(绕过机器人检测,渲染 JavaScript)
  5. 转换 — 将爬取的 HTML 转换为带有元数据头部的干净 Markdown
  6. 保存 — 将每个 Markdown 文件写入工作区目录

流程示意图

Gmail IMAP ──► 按主题筛选 ──► 提取链接


Playwright + Chromium(无头)


HTML → Markdown(html2text)


保存到 OpenClaw 工作区

CLI 参考

usage: gmaillinkarchiver.py [-h] [--mailbox MAILBOX]
[--subject-prefix PREFIX]
[--workspace PATH]
[--max-links N]
[--reconfigure]

选项:
--mailbox, -m 要搜索的 IMAP 邮箱(默认:来自配置)
--subject-prefix, -s 筛选邮件的主题前缀
--workspace, -w 保存 Markdown 文件的目录
--max-links 最大爬取链接数(默认:50)
--reconfigure 重新运行设置向导

输出格式

每个爬取的页面保存为带有 YAML 前置元数据的 Markdown 文件:

markdown



source: https://example.com/article
crawled_at: 2026-03-27T12:00:00Z


文章标题

转换为干净 Markdown 的文章内容...

文件使用 URL 的净化版本加上短哈希命名,以确保唯一性。

与 Claude 配合使用的示例

让 Claude 运行归档器:

运行 Gmail 链接归档器,从主题以 [ReadLater] 开头的邮件中爬取链接

Claude 将执行:

bash
python3 references/gmaillinkarchiver.py --subject-prefix [ReadLater]

或者全新设置:

用我的凭据设置 Gmail 链接归档器

bash
python3 references/gmaillinkarchiver.py --reconfigure

故障排除

应用密码被拒绝?

  • - 确保你的 Google 账号已开启两步验证
  • 在 https://myaccount.google.com/apppasswords 生成新的应用密码
  • 使用不带空格的 16 位密码

Playwright/Chromium 问题?
bash

重新安装 Chromium


python3 -m playwright install chromium

安装系统依赖(Linux)


sudo python3 -m playwright install-deps chromium

没有找到邮件?

  • - 检查邮箱名称(使用 INBOX、[Gmail]/All Mail 等)
  • 验证主题前缀完全匹配(区分大小写)
  • 尝试更宽泛的前缀

配置文件权限被拒绝?
bash
chmod 600 ~/.config/gmail-link-archiver/config.json

安全性

  • - 凭据本地存储在 ~/.config/gmail-link-archiver/config.json
  • 文件权限设置为 0600(仅所有者可读/写)
  • 凭据绝不会传输到除 IMAP 服务器以外的任何地方
  • 凭据绝不会被记录或打印到标准输出
  • 使用 Gmail 应用密码(而不是你的主 Google 密码)
  • 配置目录具有 0700 权限

系统要求

  • - Python 3.8+
  • Linux(Ubuntu/Debian)用于 MVP
  • 已启用 IMAP 并拥有应用密码的 Gmail 账号
  • 用于 IMAP 和网页爬取的互联网连接

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 gmail-link-archiver-1775988061 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 gmail-link-archiver-1775988061 技能

通过命令行安装

skillhub install gmail-link-archiver-1775988061

下载

⬇ 下载 gmail-link-archiver v1.1.0(免费)

文件大小: 9.31 KB | 发布时间: 2026-4-13 10:28

v1.1.0 最新 2026-4-13 10:28
Version 1.1.0

- Added version field to SKILL.md and updated documentation to reflect version 1.1.0.
- Made minor updates and maintenance to documentation and source files.
- No major functional changes to codebase; primarily a metadata and docs update.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部