返回顶部
p

pptx-extractPPTX内容提取

Extract content from PowerPoint (.pptx) presentations to Markdown using MinerU. Pulls slide content including text, structure, and formatting into readable output. Features: content extraction from PPTX files. Quick extraction (flash-extract) for .pptx without token. Full extraction with token for complex slides. Preserves slide structure and text formatting. Page/slide selection support. Use when you need to: extract content from PowerPoint slides, read .pptx file content, convert slides to Mar

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.4.0
安全检测
已通过
122
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pptx-extract

Pptx 提取

使用 MinerU(mineru-open-api)转换并提取 .pptx 文件内容。

安装

bash
npm install -g mineru-open-api

或通过 Go(macOS/Linux):


go install github.com/opendatalab/MinerU-Ecosystem/cli/mineru-open-api@latest

快速开始

bash

快速提取(无需令牌)


mineru-open-api flash-extract slides.pptx

保存到目录

mineru-open-api flash-extract slides.pptx -o ./out/

从 URL 提取

mineru-open-api flash-extract https://example.com/slides.pptx

指定语言

mineru-open-api flash-extract slides.pptx --language en

精确提取(需令牌,支持表格、公式、更多格式)

mineru-open-api extract slides.pptx -o ./out/

身份验证

flash-extract 无需令牌。extract 和 crawl 需要令牌:

bash
mineru-open-api auth # 交互式令牌设置
export MINERU_TOKEN=your-token # 或通过环境变量设置

在以下地址创建令牌:https://mineru.net/apiManage/token

功能特性

  • - 支持本地文件和 URL
  • flash-extract:快速提取,无需令牌(最大 10 MB / 20 页,仅支持 Markdown)
  • extract:需要令牌,完整功能(表格、公式、多格式)
  • 支持的输入格式:.pptx
  • 通过 --language 指定语言提示(默认:ch,英文使用 en)
  • 通过 --pages 指定页面范围(适用于 flash-extract 和 extract)

注意事项

  • - .pptx 支持 flash-extract 进行无需令牌的快速提取。
  • 输出默认发送到标准输出;使用 -o 保存到文件
  • 二进制格式(如 docx)需要使用 -o 标志(无法流式输出到标准输出)
  • 所有进度/状态信息发送到标准错误输出
  • MinerU 是 OpenDataLab(上海人工智能实验室)的开源项目:https://github.com/opendatalab/MinerU

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pptx-extract-1775876648 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pptx-extract-1775876648 技能

通过命令行安装

skillhub install pptx-extract-1775876648

下载

⬇ 下载 pptx-extract v0.4.0(免费)

文件大小: 1.93 KB | 发布时间: 2026-4-12 11:03

v0.4.0 最新 2026-4-12 11:03
SEO: expand description for better ClawHub vector search discovery

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部