返回顶部
s

sheet-data-enrichment表格数据增强

Enrich spreadsheet data by fetching external sources (URLs, APIs) to fill missing columns, then aggregate results into summary sheets. Use when: (1) a spreadsheet has URLs/links in one column and you need to extract specific info (author, title, date, etc.) into another column, (2) batch-processing rows that require visiting web pages to scrape/extract data, (3) creating pivot/summary tables from enriched data (group-by, sum, count), (4) user says fill in, complete the table, extract from links,

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
95
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

sheet-data-enrichment

表格数据丰富与汇总

工作流程

第一阶段:侦察

  1. 1. 读取整个表格(或指定范围)以理解数据结构
  2. 识别源列(例如URL/链接)和目标列(待填充的数据)
  3. 统计目标列中的空行——这些就是待处理项
  4. 在继续操作前与用户确认计划

第二阶段:提取

按批次处理行。对于每个目标列为空的行:

  1. 1. 在获取前对源进行分类
- 常规文章URL → web_fetch - SPA/JS渲染页面 → 浏览器自动化 - 微信公众号文章(mp.weixin.qq.com)→ 浏览器(验证码可能阻止web_fetch) - 社交媒体(微博、抖音等)→ 浏览器或标注为无可提取数据 - 死链/付费墙 → 标记给用户
  1. 2. 从获取的内容中提取目标数据
- 在多个位置搜索数据(顶部、底部、元数据) - 使用针对性模式(参见references/extraction-patterns.md) - 如有歧义,标记为人工审核而非猜测
  1. 3. 写入前核实(每篇先核实):
- 确认提取的值正确后再写入表格 - 如有已知映射则交叉引用 - 批量处理时,先验证样本,再应用模式

第三阶段:回写

  1. 1. 将确认的值写入目标列
  2. 始终验证行对齐——写入前读取该行以确认目标单元格与预期条目匹配
  3. 使用单单元格写入(G5:G5)而非裸引用(G5)
  4. 飞书表格:范围格式必须为sheetId!G5:G5

第四阶段:汇总

当用户请求聚合时:

  1. 1. 重新读取所有已丰富数据的表格以捕获任何手动修正
  2. 按请求的维度分组(例如,负责人→贡献者→合计)
  3. 按总计降序排列分组以便阅读
  4. 输出到新表格/电子表格,包含表头+小计+总计

关键经验(提取)

在网页上查找数据的位置

数据位置因来源而异。始终检查多个位置:

位置示例
标题下方作者:张三 / By Jane Doe
文章末尾
(记者 李四) / Reporter: John |
| 时间戳前 | 王五 2026-03-18 14:00 |
| 元数据行 | 文|赵六 / Author: Sarah |
| 组合格式 | 采写:记者 孙七 编辑:周八 |

仅检查页面顶部后切勿得出无数据的结论。 始终也要检查页面底部。

何时使用浏览器 vs web_fetch

信号工具
静态HTML,服务端渲染web_fetch(快速、低成本)
返回空/最小内容
切换到浏览器 | | URL包含mp.weixin.qq.com | 浏览器(微信验证码) | | SPA框架(React/Vue/Angular) | 浏览器 | | 百度小程序(smartapps.cn) | 浏览器或寻找替代URL | | 社交媒体嵌入(微博、抖音) | 浏览器,但通常无结构化数据 |

可复用映射

当同一来源在跨行/跨表中始终映射到相同值时:

  1. 1. 确认2个以上实例后建立映射表
  2. 将映射应用于后续行,无需重新获取
  3. 始终记录映射来源以备审计

常见的无数据模式

以下格式通常没有个人署名:

  • - 快讯/通讯社消息(如财联社电、每经AI快讯)
  • 新闻稿/公司公告
  • 无原始署名的社交媒体转发
  • 聚合综述文章

清晰标记这些内容(留空或根据用户偏好使用占位符如/)。

行对齐安全

关键:偏移一位错误是写入电子表格时的头号失败模式。

每次写入前:

  1. 1. 读取目标行以验证相邻单元格与预期匹配
  2. 如处理多行,定期重新读取以捕获偏移
  3. 切勿假设数据中的第N行对应表格中的第N行——始终验证

飞书表格特定说明

  • - 范围格式:sheetId!A1:B2(非工作表名称)
  • 单单元格写入:sheetId!G5:G5(非sheetId!G5)
  • 通过feishu_sheet操作的info获取工作表ID
  • 写入返回revision号——可用于跟踪变更
  • 无法通过API在现有电子表格中创建新工作表标签;为汇总结果创建新电子表格

输出格式

汇总表应包含:

  • - 表头:分组维度、明细维度、计数、总计
  • 小计:每组
  • 总计:最后一行
  • 排序:每组内按总计降序排列,组按小计降序排列

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 sheet-data-enrichment-1775984581 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 sheet-data-enrichment-1775984581 技能

通过命令行安装

skillhub install sheet-data-enrichment-1775984581

下载

⬇ 下载 sheet-data-enrichment v1.0.0(免费)

文件大小: 4.78 KB | 发布时间: 2026-4-13 11:58

v1.0.0 最新 2026-4-13 11:58
Initial release: spreadsheet data enrichment from URLs + aggregation/summary workflow. Includes extraction patterns for Chinese and English media bylines, browser vs web_fetch decision guide, row alignment safety, and Feishu Sheets specifics.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部