返回顶部
m

mineru-ocr-local-api本地文档OCR解析

Parse complex PDFs and document images with MinerU through either the hosted MinerU API or the local open-source MinerU runtime. Use when Codex, OpenClaw, Claude Code, or similar coding agents need MinerU-based OCR, layout-aware Markdown extraction, formula extraction, local-file upload to the MinerU API, local MinerU CLI parsing from https://github.com/opendatalab/MinerU, mode selection between api and local, task polling, archive download, or complete document text extraction.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.1.4
安全检测
已通过
207
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

mineru-ocr-local-api

MinerU OCR 本地 API

硬性规则

  1. 1. 每次 MinerU 请求必须使用 python scripts/mineru_caller.py。
  2. 不要自行解析文档作为后备方案。
  3. 如果 MinerU 返回错误,显示错误并停止。
  4. 将保存的 JSON 信封和生成的工件文件视为事实来源。
  5. 当用户请求完整的提取文档时,优先使用顶层的 text 字段。

选择模式

  • - 当用户想要托管的 MinerU 服务、已有 MINERUAPITOKEN、需要 URL 输入或想要官方云 API 工作流时,使用 --mode api。
  • 当用户想要来自 https://github.com/opendatalab/MinerU 的开源 MinerU 运行时、希望数据保留在本地或明确要求本地解析时,使用 --mode local。
  • 仅当用户不关心使用哪种模式时,使用 --mode auto。auto 模式在配置了 MINERUAPITOKEN 时优先使用 API,仅对本地文件回退到本地模式。

标准工作流程

  1. 1. 从 URL 进行托管 API 解析:

bash
python scripts/mineru_caller.py --mode api --file-url https://example.com/paper.pdf --pretty

  1. 2. 从本地文件进行托管 API 解析:

bash
python scripts/mineru_caller.py --mode api --file-path C:/docs/paper.pdf --pretty

  1. 3. 本地开源 MinerU 解析:

bash
python scripts/mineru_caller.py --mode local --file-path C:/docs/paper.pdf --pretty

  1. 4. 当输入是本地文件且用户需要 IDE 可访问的路径时,优先保存到源文件旁边:

bash
python scripts/mineru_caller.py --mode local --file-path C:/docs/paper.pdf --download-dir C:/docs/paper.mineru --pretty

  1. 5. 在回答前读取以下输出字段:
- mode:实际使用的执行模式 - text:来自 full.md 或 .md 的完整文档 Markdown - result.submit:API URL 解析的原始任务创建响应 - result.batch:API 本地文件解析的原始上传批次响应 - result.poll:最终 API 任务状态负载 - result.local:本地 MinerU CLI 调用摘要 - artifacts.fullmdpath:主 Markdown 文件的绝对路径 - artifacts.localparsedir:使用 --mode local 时的本地 MinerU 解析目录 - artifacts.downloaded_zip:使用 --mode api 时下载的 MinerU 归档文件

有用的标志

  • - --mode api|local|auto:选择托管 API、本地运行时或自动选择
  • --no-wait:提交后返回而不轮询;仅 API 模式
  • --no-download:跳过下载 fullzipurl;仅 API 模式
  • --download-dir DIR:将 API 下载或本地 MinerU 输出存储在特定目录中
  • --language en:传递语言提示
  • --ocr:强制 OCR 模式
  • --disable-formula:关闭公式提取
  • --local-cmd PATH:mineru.exe 或 mineru 的显式路径
  • --local-python PATH:python -m mineru.cli.client 的显式 Python 路径
  • --local-backend pipeline:选择本地 MinerU 后端
  • --local-method auto|txt|ocr:选择本地 MinerU 解析方法
  • --local-model-source modelscope:在 Hugging Face 访问受限的环境中很有用
  • --local-device cpu:需要时强制使用本地推理设备

呈现结果

  • - 如果用户请求所有文本,显示顶层的 text 字段。
  • 如果用户询问文件保存位置,报告 artifacts 中的路径。
  • 如果输出很大,先给出保存的文件路径,然后给出请求的摘录或摘要。
  • 如果 API 模式完成但归档下载失败,报告 artifacts.fullzipurl。

配置

API 模式:

text
MINERUAPITOKEN
MINERUAPIBASE_URL=https://mineru.net
MINERUAPITIMEOUT=60
MINERUAPIPOLL_TIMEOUT=900
MINERUAPIPOLL_INTERVAL=5

Windows PowerShell 示例:

powershell
$env:MINERUAPITOKEN=YOURMINERUTOKEN
setx MINERUAPITOKEN YOURMINERUTOKEN

第一个命令仅用于当前终端。使用 setx 使其持久化到未来终端,然后重启 Codex/Cursor 或打开新终端。

对于本地模式,至少配置一个运行时入口点:

text
MINERULOCALCMD=C:\path\to\mineru.exe
MINERULOCALPYTHON=C:\path\to\python.exe
MINERULOCALBACKEND=pipeline
MINERULOCALMETHOD=auto
MINERULOCALLANG=ch
MINERULOCALMODEL_SOURCE=modelscope
MINERULOCALDEVICE_MODE=cpu
MINERULOCALTIMEOUT=3600

本地模式仅支持 --file-path。不接受 --file-url。

错误处理

  • - 缺少 API 令牌:显示配置错误,告诉用户设置 MINERUAPITOKEN,并包含一次性命令和持久化命令。
  • 缺少本地运行时:显示配置错误并停止。
  • 任务失败或本地 CLI 运行失败:显示错误并停止。
  • 轮询超时:告诉用户任务 ID 以及轮询已超时。
  • API 归档下载 TLS 错误:在报告失败之前依赖内置的 curl 回退。
  • 缺少预期的输出文件:返回任何存在的工件路径并报告缺少的输出。

参考资料

  • - references/output_schema.md:两种模式的 JSON 信封和工件布局。

在以下情况下加载参考文件:

  • - 需要解释哪些保存的文件重要。
  • 需要检查特定模式的工件,如 downloadedzip、localparsedir、middlejson 或 content_list。

验证

验证技能文件夹:

bash
python /path/to/quick_validate.py /path/to/mineru-ocr-api-local

对示例 PDF 运行本地运行时检查:

bash
python scripts/mineru_caller.py --mode local --file-path D:/path/to/file.pdf --pretty --stdout

对远程 PDF 运行 API 运行时检查:

bash
python scripts/mineru_caller.py --mode api --file-url https://example.com/file.pdf --pretty --stdout

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 mineru-ocr-local-api-1776377222 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 mineru-ocr-local-api-1776377222 技能

通过命令行安装

skillhub install mineru-ocr-local-api-1776377222

下载

⬇ 下载 mineru-ocr-local-api v1.1.4(免费)

文件大小: 14.94 KB | 发布时间: 2026-4-17 15:24

v1.1.4 最新 2026-4-17 15:24
Improve missing-token guidance with explicit setup location and copy-paste PowerShell commands for API mode.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部