Paper to Markdown - Researcher Tool
Convert PDF files to clean Markdown using MinerU Open API. No API key required.
Quick Start
CODEBLOCK0
Language Rule
You MUST reply to the user in the SAME language they use. This is non-negotiable.
Capabilities
- - Extracts text, tables, and formulas from PDF
- Supports both local files and URLs directly
- Page range selection with INLINECODE0
- Language hint with
--language (default: ch, use en for English) - No API key, no signup, no authentication
- Max 10MB / 20 pages per document
When to Use
- - User asks to "read", "extract", "convert", or "parse" a PDF
- User shares a PDF file or PDF link and asks for its content
- User wants to summarize or analyze a PDF document
- User needs PDF content in Markdown format
CLI Reference
Run mineru-open-api flash-extract --help for all available options.
Data Flow
INLINECODE5 sends the document to the MinerU API (mineru.net) for processing and returns Markdown. This is a stateless API call — no account, no persistent storage. MinerU is an open-source project by OpenDataLab (Shanghai AI Lab): https://github.com/opendatalab/MinerU
Notes
- - Output is Markdown only; images/tables/formulas may be replaced with placeholders
- For larger files (up to 200MB/600 pages) or precision extraction with full assets, use
mineru-open-api extract (requires auth via mineru-open-api auth) - If the CLI cannot be installed via npm/uv/go, download it from https://mineru.net/ecosystem?tab=cli
技能名称: paper-to-markdown
详细描述:
Paper to Markdown - 研究人员工具
使用 MinerU 开放 API 将 PDF 文件转换为干净的 Markdown 格式。无需 API 密钥。
快速开始
bash
Paper to Markdown - 研究人员工具
mineru-open-api flash-extract report.pdf
Paper to Markdown - 研究人员工具
mineru-open-api flash-extract https://cdn-mineru.openxlab.org.cn/demo/example.pdf
Paper to Markdown - 研究人员工具
mineru-open-api flash-extract report.pdf -o ./output/
Paper to Markdown - 研究人员工具
mineru-open-api flash-extract report.pdf --pages 1-10
语言规则
您必须使用与用户相同的语言回复。此规则不可更改。
功能
- - 从 PDF 中提取文本、表格和公式
- 直接支持本地文件和 URL
- 使用 --pages 选择页面范围
- 使用 --language 指定语言提示(默认:ch,英文使用 en)
- 无需 API 密钥、无需注册、无需身份验证
- 每个文档最大 10MB / 20 页
使用场景
- - 用户要求“读取”、“提取”、“转换”或“解析”PDF
- 用户分享 PDF 文件或 PDF 链接并询问其内容
- 用户想要总结或分析 PDF 文档
- 用户需要 Markdown 格式的 PDF 内容
CLI 参考
运行 mineru-open-api flash-extract --help 查看所有可用选项。
数据流
flash-extract 将文档发送至 MinerU API(mineru.net)进行处理,并返回 Markdown 格式结果。这是一个无状态 API 调用——无需账户,无持久存储。MinerU 是 OpenDataLab(上海人工智能实验室)的开源项目:https://github.com/opendatalab/MinerU
注意事项
- - 输出仅为 Markdown 格式;图片/表格/公式可能会被替换为占位符
- 对于更大的文件(最大 200MB/600 页)或需要完整资源的精确提取,请使用 mineru-open-api extract(需通过 mineru-open-api auth 进行身份验证)
- 如果无法通过 npm/uv/go 安装 CLI,请从 https://mineru.net/ecosystem?tab=cli 下载