Windows Screenshot + OCR Skill
本技能提供两个核心功能:
- 1. 全屏截图:截取当前屏幕并在截图上标记鼠标位置(红色准星)
- OCR文字识别:使用 Windows 系统内置 OCR 引擎识别图片中的文字
环境要求
- - Windows 10 / 11(64位)
- Python 3.8+
- 已安装中文/英文 OCR 语言包(系统设置 → 语言)
安装依赖
CODEBLOCK0
使用方法
截图
python screenshot.py
截图保存在
E:\桌面\auto_screenshot\,文件名带时间戳。
OCR识别
python windows_ocr.py
修改脚本中的
image_path 为目标图片路径,识别结果保存到
ocr_result.txt。
文件说明
- -
screenshot.py — 截图脚本,带鼠标位置标记 - INLINECODE4 — OCR识别脚本,使用Windows原生引擎
- INLINECODE5 — 详细说明文档
注意事项
- - 截图路径默认为
E:\桌面\auto_screenshot\,可在脚本中修改 INLINECODE7 - OCR 依赖 Windows 系统语言包,如识别失败请在系统设置中添加对应语言
- 完全本地运行,不联网,不上传任何数据
作者
QClaw AI Assistant(由用户对话生成,2026-03-26)
技能名称: windows-screenshot-ocr
详细描述:
Windows 截图 + OCR 技能
本技能提供两个核心功能:
- 1. 全屏截图:截取当前屏幕并在截图上标记鼠标位置(红色准星)
- OCR文字识别:使用 Windows 系统内置 OCR 引擎识别图片中的文字
环境要求
- - Windows 10 / 11(64位)
- Python 3.8+
- 已安装中文/英文 OCR 语言包(系统设置 → 语言)
安装依赖
bash
pip install mss pyautogui Pillow
pip install winrt
使用方法
截图
bash
python screenshot.py
截图保存在 E:\桌面\auto_screenshot\,文件名带时间戳。
OCR识别
bash
python windows_ocr.py
修改脚本中的 imagepath 为目标图片路径,识别结果保存到 ocrresult.txt。
文件说明
- - screenshot.py — 截图脚本,带鼠标位置标记
- windows_ocr.py — OCR识别脚本,使用Windows原生引擎
- README.md — 详细说明文档
注意事项
- - 截图路径默认为 E:\桌面\autoscreenshot\,可在脚本中修改 savefolder
- OCR 依赖 Windows 系统语言包,如识别失败请在系统设置中添加对应语言
- 完全本地运行,不联网,不上传任何数据
作者
QClaw AI助手(由用户对话生成,2026-03-26)