ocr-pro专业级OCR

Professional-grade OCR for PDFs and images using MinerU. Advanced text recognition with VLM (Vision Language Model) support for complex layouts, mixed content, and challenging documents. Features: high-accuracy OCR for PDFs and images (.png, .jpg, .jpeg, .webp). VLM mode for complex visual layouts with mixed text, tables, and figures. Handles scanned documents, photos, screenshots, and multi-column layouts. Multiple output formats. Use when you need to: OCR a document with high accuracy, extract

作者: admin | 来源: ClawHub

Ocr Pro

使用 MinerU（mineru-open-api）从 .pdf / 图片（.png/.jpg/.jpeg/.jp2/.webp/.gif/.bmp）中转换并提取内容。

安装

bash
npm install -g mineru-open-api

或通过 Go（macOS/Linux）：

go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

提取（需要令牌：mineru-open-api auth）

mineru-open-api extract scanned.pdf -o ./out/

从 URL 提取

mineru-open-api extract https://example.com/scanned.pdf -o ./out/

指定语言

mineru-open-api extract scanned.pdf --language en -o ./out/

身份验证

extract 和 crawl 命令需要令牌：

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

在以下地址创建令牌：https://mineru.net/apiManage/token

功能

- 支持本地文件和 URL
需要令牌（mineru-open-api auth 或 MINERU_TOKEN 环境变量）
支持的输入格式：.pdf / 图片（.png/.jpg/.jpeg/.jp2/.webp/.gif/.bmp）
使用 --language 指定语言（默认：ch，英文使用 en）
使用 --pages 指定页码范围（适用时）

注意事项

- OCR 仅能通过带令牌的 extract 命令使用。使用 --ocr 标志。对于复杂布局，使用 --model vlm。
默认输出到标准输出；使用 -o 保存到文件
二进制格式（docx）需要使用 -o 标志（无法流式输出到标准输出）
所有进度/状态信息输出到标准错误
MinerU 是 OpenDataLab（上海人工智能实验室）的开源项目：https://github.com/opendatalab/MinerU

ocr-pro专业级OCR

ocr-pro

Ocr Pro

Install

Quick Start

Authentication

Capabilities

Notes

Ocr Pro

安装

或通过 Go（macOS/Linux）：

快速开始

提取（需要令牌：mineru-open-api auth）

从 URL 提取

指定语言

身份验证

功能

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

ocr-pro专业级OCR

ocr-pro

Ocr Pro

Install

Quick Start

Authentication

Capabilities

Notes

Ocr Pro

安装

或通过 Go（macOS/Linux）：

快速开始

提取（需要令牌：mineru-open-api auth）

从 URL 提取

指定语言

身份验证

功能

注意事项

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement