返回顶部
t

table-ocr表格OCR识别

OCR and extract tables from scanned PDFs and images using MinerU. Recognizes table structures in image-based documents and converts them to structured Markdown. Features: table detection and recognition from PDFs and images (.png, .jpg, .jpeg, .webp). OCR for scanned documents with image-embedded tables. Supports complex table layouts with merged cells. Combined OCR and table extraction in one pass. Use when you need to: extract tables from scanned PDFs, OCR tables from images, convert image tab

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
185
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

table-ocr

表格OCR

使用MinerU(mineru-open-api)从.pdf/图片(.png/.jpg/.jpeg/.webp)中转换并提取内容。

安装

bash
npm install -g mineru-open-api

或通过Go安装(macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

从PDF中提取表格(需要令牌)


mineru-open-api extract report.pdf -o ./out/

对扫描文档使用显式表格标记和OCR

mineru-open-api extract scanned.pdf --ocr --table -o ./out/

身份验证

extract和crawl命令需要令牌:

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

在以下地址创建令牌:https://mineru.net/apiManage/token

功能特性

  • - 支持本地文件和URL
  • 需要令牌(mineru-open-api auth或MINERU_TOKEN环境变量)
  • 支持的输入格式:.pdf / 图片(.png/.jpg/.jpeg/.webp)
  • 通过--language指定语言(默认:ch,英文使用en)
  • 通过--pages指定页码范围(适用时)

注意事项

  • - 表格识别需要使用令牌执行extract命令。对扫描内容使用--ocr,对表格检测使用--table(extract中默认同时启用两者)
  • 输出默认发送到标准输出;使用-o 保存到文件
  • 二进制格式(docx)需要使用-o标记(无法流式输出到标准输出)
  • 所有进度/状态消息发送到标准错误输出
  • MinerU是OpenDataLab(上海人工智能实验室)的开源项目:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 table-ocr-1775989981 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 table-ocr-1775989981 技能

通过命令行安装

skillhub install table-ocr-1775989981

下载

⬇ 下载 table-ocr v0.4.0(免费)

文件大小: 1.92 KB | 发布时间: 2026-4-13 12:15

v0.4.0 最新 2026-4-13 12:15
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部