返回顶部
p

pic2md 图片转Markdown

Image to Markdown - extract text from images (PNG, JPG, WebP) to Markdown with OCR. Use when reading text from screenshots, photos, scanned pages, or any image file."

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
125
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pic2md

Pic2MD - 图片转Markdown解析器

使用MinerU开放API从图片中提取文本并转换为Markdown格式。无需API密钥。

快速开始

bash

Pic2MD - 图片转Markdown解析器


mineru-open-api flash-extract screenshot.png

Pic2MD - 图片转Markdown解析器

mineru-open-api flash-extract https://example.com/image.png

Pic2MD - 图片转Markdown解析器

mineru-open-api flash-extract photo.jpg -o ./output/

Pic2MD - 图片转Markdown解析器

mineru-open-api flash-extract scan.jpg --language en

语言规则

您必须使用与用户相同的语言进行回复。此规则不可协商。

功能特性

  • - 支持PNG、JPG、JPEG、WebP、BMP、TIFF格式的OCR文本提取
  • 支持本地文件和URL链接直接处理
  • 通过--language参数指定语言提示(默认:ch,英文使用en)
  • 无需API密钥、无需注册、无需身份验证
  • 单张图片最大10MB

适用场景

  • - 用户要求读取、提取或OCR图片内容
  • 用户分享截图并询问其中内容
  • 用户需要从文档或白板照片中获取文字
  • 用户需要将图片内容转换为Markdown格式

CLI参考

运行mineru-open-api flash-extract --help查看所有可用选项。

数据隐私

  • - flash-extract会将图片上传至MinerU的云端API进行处理并返回结果。无需账户或API密钥。
  • 图片实时处理,提取完成后不会存储。
  • 详情请访问 https://mineru.net

注意事项

  • - 输出为通过OCR提取的Markdown格式文本
  • 如需更高精度或批量处理,请使用mineru-open-api extract(需通过mineru-open-api auth进行身份验证)
  • 如果无法通过npm/uv/go安装CLI,请从 https://mineru.net/ecosystem?tab=cli 下载

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pic2md-1776030017 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pic2md-1776030017 技能

通过命令行安装

skillhub install pic2md-1776030017

下载

⬇ 下载 pic2md v1.0.0(免费)

文件大小: 1.64 KB | 发布时间: 2026-4-13 11:28

v1.0.0 最新 2026-4-13 11:28
- Initial release of pic2md skill.
- Extracts text from images (PNG, JPG, WebP, BMP, TIFF) to Markdown using OCR.
- Supports both local image files and URLs; no API key or authentication required.
- Allows language hints (default: Chinese, use --language en for English).
- Processes images up to 10MB via MinerU Open API; processed data is not stored.
- Ideal for extracting or reading text from screenshots, scanned pages, and document photos.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部