返回顶部
p

pdf-to-docxPDF转Word

Convert PDF documents to Word (.docx) format using MinerU. Transforms PDF files into editable Word documents preserving layout, text, tables, and formatting. Features: PDF to DOCX conversion with layout preservation. Handles text, tables, images, and formatting. OCR mode for scanned PDFs. VLM mode for complex layouts. Page range selection for large documents. Use when you need to: convert a PDF to Word, turn a PDF into an editable document, make a PDF editable in Word, transform PDF to .docx. Us

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
165
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-to-docx

PDF 转 DOCX

使用 MinerU 将 PDF 文件转换为可编辑的 Word (.docx) 格式。

⚠️ 需要 Token。 flash-extract 不支持 DOCX 输出。使用此技能前,必须通过 mineru-open-api auth 配置 token。
⚠️ 需要输出到文件。 DOCX 是二进制格式,无法直接输出到标准输出——必须始终指定 -o <目录>。

安装

bash
npm install -g mineru-open-api

或通过 Go (macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

身份验证

需要 Token——在 https://mineru.net/apiManage/token 创建:

bash
mineru-open-api auth # 交互式 Token 设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

快速开始

bash

将 PDF 转换为 DOCX(需要 token,-o 为必选项)


mineru-open-api extract report.pdf -f docx -o ./out/

从 URL 转换

mineru-open-api extract https://example.com/report.pdf -f docx -o ./out/

带语言提示

mineru-open-api extract report.pdf -f docx --language en -o ./out/

使用 VLM 模型提高布局准确性(复杂 PDF)

mineru-open-api extract report.pdf -f docx --model vlm -o ./out/

批量转换多个 PDF

mineru-open-api extract *.pdf -f docx -o ./out/

功能特性

  • - 支持的输入:.pdf(本地文件或 URL)
  • 输出格式:通过 -f docx 输出 Word (.docx)
  • 需要 Token(mineru-open-api auth 或 MINERU_TOKEN 环境变量)
  • -o <目录> 为必选项——DOCX 无法输出到标准输出
  • 通过 --language 设置语言提示(默认:ch,英文使用 en)
  • 通过 --pages 设置页面范围(例如 1-10)
  • 支持批量模式:extract *.pdf -f docx -o ./out/

注意事项

  • - flash-extract 不支持 DOCX 输出——始终使用带 token 的 extract
  • DOCX 输出无法输出到标准输出;必须使用 -o 标志
  • 对于布局复杂、含表格或混合内容的 PDF,使用 --model vlm
  • 如需保证高保真度且无幻觉风险,使用 --model pipeline
  • 如果输出目录不存在,将自动创建
  • 所有进度/状态信息输出到 stderr
  • MinerU 由 OpenDataLab(上海人工智能实验室)开源:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-to-docx-1775899755 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-to-docx-1775899755 技能

通过命令行安装

skillhub install pdf-to-docx-1775899755

下载

⬇ 下载 pdf-to-docx v0.4.0(免费)

文件大小: 2.12 KB | 发布时间: 2026-4-12 10:56

v0.4.0 最新 2026-4-12 10:56
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部