返回顶部
i

image-reader图像读取器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
283
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

image-reader

图像阅读技能

利用豆包多模态模型分析图像内容的图像识别与理解工具。



功能特性

  • - 文本提取(OCR):从图像中提取文本,适用于文档、截图、海报、菜单等场景。
  • 图像描述:生成图像的详细描述,适用于照片、插画、表情包、UI界面等场景。
  • 通用分析:根据图像类型自动选择最佳分析策略。

API配置

项目
API端点https://ark.cn-beijing.volces.com/api/coding/v3
模型
doubao-seed-2.0-pro | | 认证方式 | API密钥(在config.yaml中配置) |

使用方法

命令行

bash

通用分析


python image_reader.py /path/to/image.png

提取文本(OCR)

python image_reader.py /path/to/image.png -p 提取图像中的所有文本

描述图像

python image_reader.py /path/to/image.png -p 详细描述这张图像

OpenClaw技能调用

安装后,您可以使用自然语言进行调用:

yaml
分析这张图像
提取图像中的文本
描述这个截图



输出结果

  • - 文本密集型图像:返回所有提取的文本,保留原始格式。
  • 非文本图像:返回详细的场景描述,包括物体、人物、颜色、风格等。
  • 混合内容:同时提供文本提取和视觉描述。

技术细节

  • - 使用兼容OpenAI的API调用豆包多模态模型
  • 图像以base64编码数据形式发送
  • 系统提示词会根据图像类型自适应,选择最合适的分析策略

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 image-reader-1775938462 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 image-reader-1775938462 技能

通过命令行安装

skillhub install image-reader-1775938462

下载

⬇ 下载 image-reader v1.0.0(免费)

文件大小: 4.87 KB | 发布时间: 2026-4-12 10:15

v1.0.0 最新 2026-4-12 10:15
- Initial release of the Image Reader Skill.
- Supports OCR text extraction from images.
- Generates detailed image descriptions for various image types.
- Automatically selects the best analysis strategy based on image content.
- Compatible with multimodal models(e.g. doubao-seed-2.0-pro, kimi-k2.5) via OpenAI-compatible API.
- Offers both command-line usage and natural language skill invocation.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部