返回顶部
g

glmocr-table表格识别

Official skill for recognizing and extracting tables from images and PDFs into Markdown format using

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
374
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

glmocr-table

GLM-OCR Table Recognition Skill / GLM-OCR 表格识别技能

使用智谱GLM-OCR版面解析API从图片和PDF中提取表格并转换为Markdown格式。

When to Use / 使用场景

  • - 从图片或扫描件中提取表格
  • 将表格图片转为Markdown或可编辑格式
  • 识别含合并单元格的复杂表格
  • 解析财务报表、发票、带表格的报告
  • 用户提及提取表格、识别表格、表格识别、表格OCR、表格转文字

Key Features / 核心特性

  • - 支持复杂表格:处理合并单元格、嵌套表格、多行表头
  • Markdown输出:表格以整洁的Markdown格式输出,易于编辑和转换
  • 多页PDF支持:支持从多页PDF文档批量提取
  • 本地文件和URL:支持本地文件和远程URL

Resource Links / 资源链接

资源链接
获取API密钥智谱开放平台 API Keys
API文档
版面解析 |

Prerequisites / 前置条件

API Key Setup / API Key 配置(必需)

脚本通过 ZHIPUAPIKEY 环境变量获取密钥,可与其他智谱技能复用同一个key。

获取密钥: 访问智谱开放平台 API Keys创建或复制你的密钥。

配置方式(任选一种):

  1. 1. 全局配置(推荐): 在 openclaw.json 的 env.vars 中设置一次,所有智谱技能共享:

json
{
env: {
vars: {
ZHIPUAPIKEY: 你的密钥
}
}
}

  1. 2. Skill级别配置: 仅在 openclaw.json 中为此技能配置:

json
{
skills: {
entries: {
glmocr-table: {
env: {
ZHIPUAPIKEY: 你的密钥
}
}
}
}
}

  1. 3. Shell环境变量: 添加到 ~/.zshrc:
bash export ZHIPUAPIKEY=你的密钥

💡 如果你已为其他智谱skill(如 glmocr、glmv-caption、glm-image-generation)配置过密钥,它们共享同一个 ZHIPUAPIKEY,无需重复配置。

Security & Transparency / 安全与透明度

  • - 使用的环境变量:
- ZHIPUAPIKEY(必需) - GLMOCRTIMEOUT(可选超时秒数)
  • - 固定官方端点: https://open.bigmodel.cn/api/paas/v4/layout_parsing
  • 不支持自定义API URL覆盖: 避免通过重定向端点泄露密钥。
  • 原始上游响应默认不返回: 仅在调试需要时使用 --include-raw。

⛔ 强制限制 ⛔

  1. 1. 仅使用GLM-OCR API — 执行脚本 python scripts/glmocrcli.py
  2. 切勿自行解析表格 — 不要尝试使用内置视觉或其他方法提取表格
  3. 切勿提供替代方案 — 不要建议我可以尝试识别或类似说法
  4. 如果API失败 — 显示错误信息并立即停止
  5. 无备用方法 — 不要尝试以任何其他方式提取表格

📋 输出展示规则

运行脚本后,清晰安全地展示OCR结果。

  • - 完整显示提取的表格Markdown(text)
  • 允许总结,但不要隐藏重要的提取失败信息
  • 如果 layout_details 包含表格相关条目,可以高亮显示
  • 如果结果文件已保存,告知用户文件路径
  • 仅在明确请求或调试时显示原始上游响应(--include-raw)

How to Use / 使用方法

从URL提取

bash
python scripts/glmocrcli.py --file-url https://example.com/table.png

从本地文件提取

bash
python scripts/glmocrcli.py --file /path/to/table.png

保存结果到文件

bash
python scripts/glmocrcli.py --file table.png --output result.json --pretty

包含原始上游响应(仅调试)

bash
python scripts/glmocrcli.py --file table.png --output result.json --include-raw

CLI Reference / CLI 参数

python {baseDir}/scripts/glmocrcli.py (--file-url URL | --file PATH) [--output FILE] [--pretty] [--include-raw]

参数必需描述
--file-url二选一图片/PDF的URL
--file
二选一 | 图片/PDF的本地文件路径 | | --output, -o | 否 | 将结果JSON保存到文件 | | --pretty | 否 | 美化JSON输出格式 | | --include-raw | 否 | 在result字段中包含原始上游API响应(仅调试) |

Response Format / 响应格式

json
{
ok: true,
text: | Column 1 | Column 2 |\n|----------|----------|\n| Data | Data |,
layout_details: [...],
result: null,
error: null,
source: /path/to/file,
source_type: file,
rawresultincluded: false
}

关键字段:

  • - ok — 提取是否成功
  • text — 提取的Markdown文本(用于展示)
  • layout_details — 版面分析详情
  • error — 失败时的错误详情

Error Handling / 错误处理

API密钥未配置:

ZHIPUAPIKEY not configured. Get your API key at: https://bigmodel.cn/usercenter/proj-mgmt/apikeys

→ 向用户显示确切错误,引导他们配置

认证失败(401/403): API密钥无效/已过期 → 重新配置

速率限制(429): 配额已用完 → 告知用户等待

文件未找到: 本地文件缺失 → 检查路径

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 glmocr-table-1776193321 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 glmocr-table-1776193321 技能

通过命令行安装

skillhub install glmocr-table-1776193321

下载

⬇ 下载 glmocr-table v1.0.2(免费)

文件大小: 7.72 KB | 发布时间: 2026-4-17 14:57

v1.0.2 最新 2026-4-17 14:57
- Clarified that this is the official skill for table extraction using ZhiPu GLM-OCR.
- Updated resource links, including a new API documentation URL.
- Expanded API key setup instructions: added a global config option and clarified sharing with other Zhipu skills.
- Updated skill emoji from 📄 to 📊 in the metadata.
- Minor wording and formatting improvements for greater clarity and consistency.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部