返回顶部
e

extract-formulas-from-pdfPDF公式提取

Extract mathematical formulas and equations from PDF documents using MinerU. Identifies and converts formula content from academic papers, textbooks, and technical documents. Features: formula detection and extraction from PDFs. Converts formulas to LaTeX representation. Handles inline and display equations. Works with both native and scanned PDF formulas via OCR. Use when you need to: extract formulas from a PDF, get equations from an academic paper, convert PDF math to LaTeX, pull mathematical

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
155
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

extract-formulas-from-pdf

从PDF中提取公式

使用MinerU(mineru-open-api)转换并提取.pdf文件中的内容。

安装

bash
npm install -g mineru-open-api

或通过Go安装(macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

从PDF中提取公式(需要令牌)


mineru-open-api extract paper.pdf -o ./out/

使用VLM提高公式识别精度

mineru-open-api extract paper.pdf --model vlm -o ./out/

身份认证

extract和crawl命令需要令牌:

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

在以下地址创建令牌:https://mineru.net/apiManage/token

功能特性

  • - 支持本地文件和URL
  • 需要令牌(mineru-open-api auth或MINERU_TOKEN环境变量)
  • 支持的输入格式:.pdf
  • 通过--language指定语言(默认:ch,英文使用en)
  • 通过--pages指定页码范围(适用时)

注意事项

  • - 公式识别需要使用令牌执行extract命令。使用--formula标志(默认启用)。输出为包含LaTeX内联公式的Markdown格式。
  • 默认输出到标准输出;使用-o 保存到文件
  • 二进制格式(docx)需要使用-o标志(无法流式输出到标准输出)
  • 所有进度/状态信息输出到标准错误输出
  • MinerU是由OpenDataLab(上海人工智能实验室)开发的开源项目:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 extract-formulas-from-pdf-1775985249 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 extract-formulas-from-pdf-1775985249 技能

通过命令行安装

skillhub install extract-formulas-from-pdf-1775985249

下载

⬇ 下载 extract-formulas-from-pdf v0.4.0(免费)

文件大小: 1.99 KB | 发布时间: 2026-4-13 10:13

v0.4.0 最新 2026-4-13 10:13
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部