返回顶部
p

pdf-process-mineruPDF解析工具

PDF document parsing tool based on local MinerU, supports converting PDF to Markdown, JSON, and other machine-readable formats.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
1,441
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-process-mineru

工具列表

1. pdftomarkdown

将PDF文档转换为Markdown格式,保留文档结构、公式、表格和图片。

描述:使用MinerU解析PDF文档并以Markdown格式输出,支持OCR、公式识别、表格提取等功能。

参数

  • - filepath(字符串,必填):PDF文件的绝对路径
  • outputdir(字符串,必填):输出目录的绝对路径
  • backend(字符串,可选):解析后端,可选值:hybrid-auto-engine(默认)、pipeline、vlm-auto-engine
  • language(字符串,可选):OCR语言代码,如en(英语)、ch(中文)、ja(日语)等,默认为自动检测
  • enableformula(布尔值,可选):是否启用公式识别,默认为true
  • enabletable(布尔值,可选):是否启用表格提取,默认为true
  • startpage(整数,可选):起始页码(从0开始),默认为0
  • endpage(整数,可选):结束页码(从0开始),默认为-1表示解析所有页面

返回值
json
{
success: true,
output_path: /path/to/output,
markdown_content: 转换后的Markdown内容...,
images: [图片路径列表],
tables: [表格信息列表],
formula_count: 10
}

示例
bash
python .claude/skills/pdf-process/script/pdf_parser.py \
{name: pdftomarkdown, arguments: {filepath: /path/to/document.pdf, outputdir: /path/to/output}}

使用特定后端

python .claude/skills/pdf-process/script/pdf_parser.py \ {name: pdftomarkdown, arguments: {filepath: /path/to/document.pdf, outputdir: /path/to/output, backend: pipeline}}

解析特定页面

python .claude/skills/pdf-process/script/pdf_parser.py \ {name: pdftomarkdown, arguments: {filepath: /path/to/document.pdf, outputdir: /path/to/output, startpage: 0, endpage: 5}}

2. pdftojson

将PDF文档转换为JSON格式,包含详细的布局和结构信息。

描述:使用MinerU解析PDF文档并以JSON格式输出,包含文本块、图片、表格、公式等结构化信息。

参数

  • - filepath(字符串,必填):PDF文件的绝对路径
  • outputdir(字符串,必填):输出目录的绝对路径
  • backend(字符串,可选):解析后端,可选值:hybrid-auto-engine(默认)、pipeline、vlm-auto-engine
  • language(字符串,可选):OCR语言代码,如en(英语)、ch(中文)、ja(日语)等,默认为自动检测
  • enableformula(布尔值,可选):是否启用公式识别,默认为true
  • enabletable(布尔值,可选):是否启用表格提取,默认为true
  • startpage(整数,可选):起始页码(从0开始),默认为0
  • endpage(整数,可选):结束页码(从0开始),默认为-1表示解析所有页面

返回值
json
{
success: true,
output_path: /path/to/output.json,
pages: [
{
page_no: 0,
page_size: [595, 842],
blocks: [
{
type: text,
text: 文本内容,
bbox: [x, y, x, y]
}
],
images: [],
tables: [],
formulas: []
}
],
metadata: {
total_pages: 10,
author: 作者,
title: 标题
}
}

示例
bash
python .claude/skills/pdf-process/script/pdf_parser.py \
{name: pdftojson, arguments: {filepath: /path/to/document.pdf, outputdir: /path/to/output}}

使用特定后端和语言

python .claude/skills/pdf-process/script/pdf_parser.py \ {name: pdftojson, arguments: {filepath: /path/to/document.pdf, outputdir: /path/to/output, backend: hybrid-auto-engine, language: ch}}

安装说明

1. 安装MinerU

bash

更新pip并安装uv


pip install --upgrade pip
pip install uv

安装MinerU(包含所有功能)

uv pip install -U mineru[all]

2. 验证安装

bash

检查MinerU是否安装成功


mineru --version

测试基本功能

mineru --help

3. 系统要求

  • - Python版本:3.10-3.13
  • 操作系统:Linux / Windows / macOS 14.0+
  • 内存
- 使用pipeline后端:最低16GB,推荐32GB+ - 使用hybrid/vlm后端:最低16GB,推荐32GB+
  • - 磁盘空间:最低20GB(推荐SSD)
  • GPU(可选):
- pipeline后端:支持纯CPU运行 - hybrid/vlm后端:需要NVIDIA GPU(Volta架构及以上)或Apple Silicon

使用场景

  1. 1. 学术论文解析:提取公式、表格、图片等结构化内容
  2. 技术文档转换:将PDF文档转换为Markdown,便于版本控制和在线发布
  3. OCR处理:处理扫描版PDF和乱码PDF
  4. 多语言文档:支持109种语言的OCR识别
  5. 批量处理:批量转换多个PDF文档

后端选择建议

  • - hybrid-auto-engine(默认):精度和速度均衡,适用于大多数场景
  • pipeline:适用于纯CPU环境,兼容性最佳
  • vlm-auto-engine:精度最高,需要GPU加速

注意事项

  1. 1. 文件路径:所有路径必须为绝对路径
  2. 输出目录:不存在的目录会自动创建
  3. 性能:使用GPU可显著提升解析速度
  4. 页码:页码从0开始计数
  5. 内存:处理大型文档可能消耗较多内存

故障排除

常见问题

  1. 1. 安装失败
- 确保使用Python 3.10-3.13 - Windows仅支持Python 3.10-3.12(ray不支持3.13) - 使用uv pip install可解决大部分依赖冲突
  1. 2. 内存不足
- 使用pipeline后端 - 限制解析页面:startpage和endpage - 减少虚拟内存分配
  1. 3. 解析速度慢
- 启用GPU加速 - 使用hybrid-auto-engine后端 - 禁用不必要的功能(公式、表格)
  1. 4. OCR精度低
- 指定正确的文档语言 - 确保后端支持OCR(使用pipeline或hybrid-*)

相关资源

  • - MinerU官方文档:https://opendatalab.github.io/MinerU/
  • MinerU GitHub:https://github.com/opendatalab/MinerU
  • 在线演示:https://mineru.net/

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-parser-mineru-1776324562 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-parser-mineru-1776324562 技能

通过命令行安装

skillhub install pdf-parser-mineru-1776324562

下载

⬇ 下载 pdf-process-mineru v1.0.2(免费)

文件大小: 9.21 KB | 发布时间: 2026-4-17 15:42

v1.0.2 最新 2026-4-17 15:42
- Added a Chinese-language documentation file: SKILL_zh.md
- No changes to code or functionality; documentation is now available in both English and Chinese.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部