返回顶部
m

mineru-document-explorer矿工文档浏览器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
145
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

mineru-document-explorer

MinerU 文档浏览器

通过 doc-search 命令行工具实现的PDF阅读工具包。先搜索,再阅读相关页面——无需扫描整份PDF。

⚠️ 网络功能:本技能可选择调用外部API(PageIndex大纲生成、MinerU云端OCR、嵌入/重排序服务)并运行本地FastAPI服务器。所有网络功能均为可选,默认关闭。

路径约定

SKILL_DIR = <本文件所在父目录>
SCRIPTS = SKILL_DIR/scripts

安装检查

读取 SKILLDIR/config-state.json。如果文件缺失或 setupcomplete 不为true:

  1. 1. 阅读 references/setup.md 并运行安装程序
  2. 安装完成后,询问用户是否要配置PageIndex(例如:如果您有兼容OpenAI的API密钥,可以启用PageIndex自动生成文档大纲——这对扫描件或手册很有用。要设置吗?)
  3. 如果用户提供 pageindexapikey / pageindexbaseurl → 写入 SCRIPTS/doc-search/config.yaml;如果跳过 → 立即继续,不要阻塞

⚠️ 执行前必须阅读参考文档——禁止猜测

对参数、返回字段或查询措辞有任何不确定 → 在运行任何命令前必须阅读对应的cmd文件。不得自行推断或猜测。

  • - references/cmd-init.md / cmd-outline.md / cmd-pages.md
  • references/cmd-search-keyword.md / cmd-search-semantic.md / cmd-elements.md

对于复杂任务、错误、意外结果或不熟悉的情况 → 必须首先阅读 references/tips.md。其中包含经过验证的工作流程和来之不易的教训,可避免重复犯错。



命令速查表

所有输出均为JSON格式到标准输出。--timeout 是子命令前的全局标志;默认值为120秒。

bash
doc-search init --doc_path <路径或URL>
doc-search outline --docid [--maxdepth N] [--root_node <节点ID>]
doc-search pages --docid --pageidxs <页码> [--noimage] [--returntext]
doc-search search-keyword --docid --pageidxs <页码> --pattern <正则表达式> [--return_text]
doc-search search-semantic --docid --pageidxs <页码> --query <查询词> [--topk N] [--noimage] [--return_text]
doc-search --timeout 300 elements --docid --pageidxs <页码> --query <查询词>

关键提醒

  • - 使用 outline 和关键词搜索缩小阅读范围——切勿扫描整份文档
  • --pageidxs 是从0开始索引——不要与打印页码混淆
  • 使用 elements 提取图表后,必须读取 croppath 进行验证;查询应为实际图表图像,而非标题文本;如果查询失败,请检查 page_idxs 或重新措辞查询

经验教训(必读)

完成任何PDF任务后:遇到的陷阱/新工作流程/参数发现 → 追加到 references/tips.md,每条1-2行,仅保留结论。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 mineru-document-explorer-1775932925 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 mineru-document-explorer-1775932925 技能

通过命令行安装

skillhub install mineru-document-explorer-1775932925

下载

⬇ 下载 mineru-document-explorer v1.0.1(免费)

文件大小: 102.38 KB | 发布时间: 2026-4-12 10:35

v1.0.1 最新 2026-4-12 10:35
- Added optional credential fields for external services (PageIndex, embedding/reranker APIs, MinerU cloud).
- Enabled optional network capabilities with external API calls and FastAPI server support; all network features are opt-in and disabled by default.
- Updated documentation to clarify network functionality and new credential options.
- No code or file structure changes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部