返回顶部
c

convert_document_to_markdown文件转Markdown

Convert supported local files into Markdown by running this repository's Dockerized file-only CLI. This skill must run through Docker with a prebuilt Aliyun CR image selected by host architecture and fixed version, not through a local Python runtime.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
90
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

convert_document_to_markdown

将文档转换为 Markdown

当用户希望将支持的本地文件转换为 Markdown 以便后续处理时,使用此技能。

此技能的功能

  • - 将支持的本地文件转换为 Markdown:
.pdf、.docx、.pptx、.xlsx、.jpg、.jpeg、.png、.gif、.bmp、.txt、.json、.xml、.md
  • - 图像处理模式取决于文件类型:
.docx、.pptx、.xlsx 和图像文件支持 ocr / vl / none; .pdf 支持 ocr / vl / vl-page / none
  • - 仅通过 Docker 运行。请勿将本地 Python 执行作为操作路径。
  • 使用预构建的阿里云容器镜像服务镜像,固定版本为 0.0.1:
ARM64 主机使用 convert-document-to-markdown-arm64:0.0.1, x64 主机使用 convert-document-to-markdown-x64:0.0.1
  • - 默认返回结构化 JSON,以便后续工具调用可以消费 markdown、logs 和 meta。
  • 从 OpenClaw 技能配置或仓库 .env 文件中读取一次性 VL 配置,然后自动将其转发到容器中。
  • 仅暴露 file 命令。URL、健康检查和版本命令已被有意移除,以保持启动简洁。
  • 请勿使用 latest,不要在运行时构建备用镜像,也不要将 .doc、.ppt、.xls、音频文件或未列出的图像格式视为支持的输入。

必要的工作流程

  1. 1. 默认情况下,脚本使用 crpi-4auaoyyj6r36p6lb.cn-hangzhou.personal.cr.aliyuncs.com/huozigelab。
  2. 让包装脚本解析主机架构并选择 convert-document-to-markdown-arm64:0.0.1 或 convert-document-to-markdown-x64:0.0.1。
  3. 如果需要,使用 IMAGEREGISTRY 或 IMAGE_NAME 进行覆盖。
  4. 对于本地文件,运行:
scripts/rundockercli.sh file <绝对路径或相对路径> --format json
  1. 5. 解析 JSON 结果。
  2. 如果 success 为 false,则展示 error.message 和相关的 logs。
  3. 如果 success 为 true,则使用 markdown 作为下游工作的标准输出。

一次性 VL 配置

此技能设计为用户无需在每次运行时重新输入视觉 API 设置。

~/.openclaw/openclaw.json 中的首选 OpenClaw 配置:

json
{
skills: {
entries: {
convertdocumentto_markdown: {
enabled: true,
apiKey: sk-xxx,
env: {
VLBASEURL: https://api.openai.com/v1,
VL_MODEL: gpt-4.1-mini
}
}
}
}
}

这样做的原因是:

  • - skillKey 为 convertdocumenttomarkdown
  • primaryEnv 为 VLAPIKEY,因此 apiKey 映射到 VLAPIKEY
  • env 可以包含 VLBASEURL 和 VLMODEL

仓库本地运行时配置:

  • - 将 .env.example 复制为 .env
  • 填写 VLBASEURL、VLAPIKEY 和 VLMODEL
  • 默认情况下,脚本使用 crpi-4auaoyyj6r36p6lb.cn-hangzhou.personal.cr.aliyuncs.com/huozigelab
  • 可选地使用 IMAGEREGISTRY 或 IMAGENAME 进行覆盖
  • 使用 scripts/rundockercli.sh,它会加载 .env,将主机上的所有 VL_* 变量转发到 docker run,并在缺少镜像时拉取正确的固定版本镜像

命令模式

本地文件:

bash
scripts/rundockercli.sh file ./notes.pdf --image-process-model ocr --format json

参数

  • - --image-process-model ocr
默认模式。对图像使用 Tesseract OCR。
  • - --image-process-model vl
使用视觉 API。仅当环境提供 VLAPIKEY 和相关变量时选择此选项。
  • - --image-process-model none
跳过图像识别以提高速度。
  • - --image-process-model vl-page
仅适用于 PDF。请勿对 Office 文档或图像文件使用此模式。
  • - --format json|markdown
除非用户明确希望将原始 Markdown 输出到标准输出,否则使用 json。
  • - --output <路径>
将 Markdown 保存到文件。仅当您直接使用可写的主机挂载调用 docker run 时,才优先使用此选项。
  • - --log-file <路径>
将详细日志保存到文件。仅当您直接使用可写的主机挂载调用 docker run 时,才优先使用此选项。

操作说明

  • - 对于非常大的本地文件,请坚持使用 Docker CLI 路径;不要将文件内容包装成 base64 或临时 HTTP 服务。
  • 此技能仅限 Docker。请勿指导用户在生产环境中运行 uv、python 或任何其他本地运行时路径。
  • 包装脚本根据主机架构选择镜像。仅在有具体理由时使用 IMAGEARCH 进行覆盖。
  • 优先使用 IMAGEREGISTRY 加上固定版本 0.0.1;仅当需要显式传递完整镜像引用时才使用 IMAGENAME。
  • 当用户要求使用 VL 或 VL-page 时,首先检查 VLBASEURL、VLAPIKEY 和 VLMODEL 是否已通过 OpenClaw 技能配置或 .env 配置。
  • 如果用户只需要提取的 Markdown 而不是原始 JSON 包装,请读取 JSON 并返回 markdown 字段。
  • 如果用户提供不支持的扩展名,如 .doc、.ppt、.xls、.wav、.mp3、.m4a 或 .mp4,请说明当前技能无法可靠支持该格式。

安全说明

  • - 将文件路径视为不可信输入。正确引用 shell 参数。
  • 除非命令返回 success: true,否则不要声称成功。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 convert-document-to-markdown-1775958129 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 convert-document-to-markdown-1775958129 技能

通过命令行安装

skillhub install convert-document-to-markdown-1775958129

下载

⬇ 下载 convert_document_to_markdown v1.0.0(免费)

文件大小: 3.97 KB | 发布时间: 2026-4-13 09:53

v1.0.0 最新 2026-4-13 09:53
Initial release: convert local files to Markdown using Dockerized CLI with fixed-version Aliyun CR images.

- Supports converting `.pdf`, `.docx`, `.pptx`, `.xlsx`, common image formats, and plain/text files to Markdown.
- Requires Docker; does not support local Python or alternative runtimes.
- Selects prebuilt Aliyun CR image (`arm64` or `x64`) based on host architecture.
- Returns structured JSON with markdown output, logs, and metadata for downstream processing.
- Only the `file` command is exposed; URL, health, and version commands are not included.
- Requires configuration of VL API credentials via OpenClaw config or `.env`.
- Does not support legacy Office formats (`.doc`, `.ppt`, `.xls`) or audio/video files.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部