返回顶部
i

image2text_ocr 图片文字识别

将图片中的文字信息识别并提取出来。本技能应在用户需要 OCR 识别图片中的文字时使用。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.1.0
安全检测
已通过
147
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

image2text_ocr

Sugon-Scnet 通用 OCR 技能

本技能封装了 Sugon-Scnet 通用 OCR 服务,通过单一接口即可调用ocr识别能力,高效提取文字信息。

功能特性

  • - 通用文字识别:提取图片中的全部文字,支持横竖版及坐标定位。

前置配置

⚠️ 重要:使用前需要申请 Scnet API Token

申请 API Token

  1. 1. 访问 Scnet 官网 注册/登录
  2. 在控制台申请 API 密钥(格式:sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx)
  3. 复制密钥备用

配置 Token

方式一:让 AI 配置

“帮我配置 Scnet OCR,Token 是:xxx”

方式二:手动配置

  1. 1. 在技能目录下创建 config/.env 文件,内容如下:

ini

===== Sugon-Scnet OCR API 配置 =====


申请地址:https://www.scnet.cn


SCNETAPIKEY=yourscnetapikeyhere

API 基础地址(一般无需修改)

SCNETAPIBASE=https://api.scnet.cn/api/llm/v1

Token 更新

Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNETAPIKEY。



使用方法

参数说明

参数名类型必填描述
ocrTypestring识别类型枚举。必须为以下之一:<br>• GENERAL 通用文字
filePath
string | 是 | 待识别图片的本地绝对路径。支持 jpg、png、pdf 等常见格式。 |

命令行调用示例

bash
python .claude/skills/sugon-scnet-ocr/scripts/main.py VAT_INVOICE /path/to/invoice.jpg

在 AI 对话中使用

用户可以说:

  • - “OCR 这个图片里的文字,图片在 /Users/name/Desktop/text.png”

AI 会根据 description 中的关键词自动触发本技能。

配置选项

编辑 config/.env 文件:

变量名默认值说明
SCNETAPIKEY必需Scnet API 密钥
SCNETAPIBASE
https://api.scnet.cn/api/llm/v1 | API 基础地址(一般无需修改) |

输出

  • - 标准输出:识别结果的 JSON 数据,结构与 API 文档一致,位于 data 字段内。
  • 识别结果位于 data[0].result[0].elements 中,具体字段取决于 ocrType。
  • 错误信息:如果发生错误,会输出以 错误: 开头的友好提示。

故障排除

问题解决方案
配置文件不存在创建 config/.env 并填入 Token(参考前置配置)
API Key 无效/过期
重新申请 Token 并更新 .env 文件 | | 文件不存在 | 检查提供的文件路径是否正确 | | 网络连接失败 | 检查网络连接或防火墙设置 | | 不支持的文件类型 | 确保文件扩展名为允许的类型(参考 API 文档) | | 401/403/Unauthorized | Token 无效或过期,重新申请并配置 |

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 image2text-ocr-1775986321 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 image2text-ocr-1775986321 技能

通过命令行安装

skillhub install image2text-ocr-1775986321

下载

⬇ 下载 image2text_ocr v0.1.0(免费)

文件大小: 10.39 KB | 发布时间: 2026-4-13 10:38

v0.1.0 最新 2026-4-13 10:38
Initial release of image2text_ocr skill.

- Provides OCR capabilities to extract text and structure from images using the Sugon-Scnet OCR service.
- Supports recognition for common image formats (jpg, png, pdf).
- Requires user to configure Scnet API Token before use.
- Returns results as structured JSON with recognition confidence.
- Includes error handling for configuration, authorization, and file issues.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部