返回顶部
d

doc-extractWord文档提取

Extract text and content from Word documents (.doc, .docx) to Markdown using MinerU. A straightforward tool for reading and extracting Word file content. Features: fast text extraction from .docx with no token required (flash-extract). Full extraction for both .doc and .docx with token. Preserves basic formatting and structure. Page range selection for large documents. Use when you need to: extract text from a Word file, read content from .doc or .docx, pull text out of a Word document, get the

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
173
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

doc-extract

Doc Extract

使用MinerU从Word(.doc/.docx)文件中提取文本和内容并转换为Markdown格式。

安装

bash
npm install -g mineru-open-api

或通过Go安装(macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

快速提取.docx文件(无需令牌)


mineru-open-api flash-extract report.docx

保存到目录

mineru-open-api flash-extract report.docx -o ./out/

提取.doc文件(需要令牌)

mineru-open-api extract report.doc -o ./out/

指定语言提取

mineru-open-api extract report.docx --language en -o ./out/

身份验证

对.docx文件使用flash-extract无需令牌。对.doc文件和extract命令需要令牌:

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

创建令牌地址:https://mineru.net/apiManage/token

功能特性

  • - 支持输入:.doc、.docx(本地文件或URL)
  • .docx:支持flash-extract(无需令牌,最大10 MB / 20页)和extract
  • .doc:需要使用带令牌的extract命令
  • 通过--language指定语言(默认:ch,英文使用en)
  • 通过--pages指定页码范围(例如1-10)

注意事项

  • - .doc文件需要使用带令牌的extract命令;.docx文件可使用flash-extract快速提取
  • 默认输出到标准输出;使用-o 保存到文件或目录
  • 所有进度/状态信息输出到标准错误输出;文档内容输出到标准输出
  • MinerU由OpenDataLab(上海人工智能实验室)开源:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 doc-extract-1775986861 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 doc-extract-1775986861 技能

通过命令行安装

skillhub install doc-extract-1775986861

下载

⬇ 下载 doc-extract v0.4.0(免费)

文件大小: 1.88 KB | 发布时间: 2026-4-13 10:04

v0.4.0 最新 2026-4-13 10:04
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部