返回顶部
o

ollama-ocrOllama图像文字识别

Use Ollama's vision/OCR models to recognize text from images. Supports glm-ocr, llava, moondream, and llama3.2-vision models. Ideal when you need local offline OCR without relying on cloud APIs.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
237
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ollama-ocr

Ollama OCR 技能

当您需要使用Ollama本地视觉/OCR模型从图像中识别文字时,请使用此技能。无需互联网——完全离线OCR。

使用场景

  • - 用户发送图片并希望提取文字
  • 用户要求从截图或图片中识别文字
  • 需要本地离线OCR,不依赖云API
  • 处理不应发送给第三方的敏感图像

可用模型

模型最佳用途大小
glm-ocr:latest中文文字OCR~2.2GB
llava:7b
通用图像理解 | ~4.7GB | | moondream | 轻量级视觉模型 | ~1.5GB | | llama3.2-vision:latest | 大型视觉模型 | ~7GB以上 |

Ollama端点

默认:http://172.17.0.2:11434(Docker容器到宿主机网关)

注意: 端点已预配置为在Docker中运行的OpenClaw访问宿主机Ollama。如果您的设置不同,请在ollamaocr.py中调整OLLAMAHOST。

使用方法

命令行

bash
python3 ollamaocr.py /path/to/image.jpg [modelname]

示例:
bash
python3 ollama_ocr.py receipt.png glm-ocr:latest
python3 ollama_ocr.py screenshot.jpg llava:7b

Python API

python
from ollamaocr import ollamaocr

使用默认模型(glm-ocr)进行基本OCR

result = ollama_ocr(/path/to/image.jpg)

指定模型

result = ollama_ocr(/path/to/image.jpg, glm-ocr:latest)

print(result)

激活此技能的示例提示词

  • - 识别这张图片里的文字
  • 帮我 OCR 一下这个截图
  • Extract text from this image
  • What text is in this screenshot?

注意事项

  • - 图片路径必须是绝对路径或相对于脚本位置的路径
  • 对于大图片,建议先调整大小以避免超时
  • glm-ocr 最适合中文文字
  • 某些模型可能存在输出异常(例如,glm-ocr偶尔会重复)
  • 如果模型未缓存到内存中,首次调用可能会较慢

要求

  • - 已安装并运行Ollama
  • 至少下载一个视觉/OCR模型(例如,ollama pull glm-ocr:latest)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ollama-ocr-1776107282 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ollama-ocr-1776107282 技能

通过命令行安装

skillhub install ollama-ocr-1776107282

下载

⬇ 下载 ollama-ocr v1.0.0(免费)

文件大小: 2.75 KB | 发布时间: 2026-4-17 15:35

v1.0.0 最新 2026-4-17 15:35
Initial release - local OCR with Ollama vision models

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部