Sugon-Scnet 通用 OCR 技能
本技能封装了 Sugon-Scnet 通用 OCR 服务,通过单一接口即可调用 31 种识别能力,高效提取文字及票据信息。
功能特性
- - 通用文字识别:提取图片中的全部文字,支持横竖版及坐标定位。
- 个人证照:识别居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证。
- 行业资质:识别营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书。
- 财务票据:覆盖增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票,自动提取关键字段。
前置配置
⚠️ 重要:使用前需要申请 Scnet API Token
申请 API Token
- 1. 访问 Scnet 官网 注册/登录
- 在控制台申请 API 密钥(格式:
sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx) - 复制密钥备用
配置 Token
方式一:让 AI 配置
“帮我配置 Scnet OCR,Token 是:xxx”
方式二:手动配置
- 1. 在技能目录下创建
config/.env 文件,内容如下:
CODEBLOCK0
Token 更新
Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNETAPIKEY。
使用方法
参数说明
| 参数名 | 类型 | 必填 | 描述 |
|---|
| ocrType | string | 是 | 识别类型枚举。必须为以下之一:<br>• GENERAL(通用文字)<br>• IDCARD(身份证)<br>• BANKCARD(银行卡)<br>• SOCIALSECURITYCARD(社保卡)<br>• HOUSEHOLDREGISTER(户口本)<br>• BIRTHCERTIFICATE(出生医学证明)<br>• HKMACAUPASS(往来港澳通行证)<br>• TAIWANPASS(往来台湾通行证)<br>• TAIWANMAINLANDPASS(台湾居民来往大陆通行证)<br>• HKMAINLANDPASS(港澳居民来往内地通行证)<br>• BUSINESSLICENSE(营业执照)<br>• SOCIALORGREG(社会团体法人登记证书)<br>• TRADEUNIONREG(工会法人资格证书)<br>• RELIGIOUSACTIVITYREG(宗教活动场所登记证)<br>• PRIVATENONENTERPRISEREG(民办非企业单位登记证书)<br>• INSTITUTIONLEGALREG(事业单位法人证书)<br>• UNIFIEDSOCIALCREDITREG(统一社会信用代码证书)<br>• VATINVOICE(增值税发票)<br>• VATROLLINVOICE(增值税卷票)<br>• TAXIINVOICE(出租车发票)<br>• TRAINTICKET(火车票)<br>• AIRPORTTICKET(航空运输电子客票行程单)<br>• VEHICLESALEINVOICE(机动车销售统一发票)<br>• QUOTAINVOICE(定额发票)<br>• TOLLINVOICE(过路过桥费发票)<br>• MEDICALINVOICE(医疗门诊发票)<br>• TAXCERTIFICATE(税收完税证明)<br>• SHIPTICKET(船票)<br>• NONTAXBILL(非税票据)<br>• GENERALMACHINEINVOICE(通用机打发票)<br>• BUSTICKET(汽车票) |
| filePath |
string | 是 | 待识别图片的本地绝对路径。支持 jpg、png、pdf 等常见格式。 |
命令行调用示例
CODEBLOCK1
在 AI 对话中使用
用户可以说:
- - “帮我识别这张身份证,图片在 /Users/name/Downloads/id.jpg”
- “提取这张发票的信息,路径是 /Users/name/Downloads/fapiao.png”
- “OCR 这个图片里的文字,图片在 /Users/name/Desktop/text.png”
AI 会根据 description 中的关键词自动触发本技能。
AI 调用建议
为避免触发 API 速率限制(10 QPS),请串行调用本技能,即等待前一个识别完成后再发起下一个请求。
如果使用 OpenClaw 的 exec 工具,建议设置 timeout 或 yieldMs 参数,让命令同步执行,避免多个命令同时运行导致并发。
配置选项
编辑 config/.env 文件:
| 变量名 | 默认值 | 说明 |
|---|
| SCNETAPIKEY | 必需 | Scnet API 密钥 |
| SCNETAPIBASE |
https://api.scnet.cn/api/llm/v1 | API 基础地址(一般无需修改) |
输出
- - 标准输出:识别结果的 JSON 数据,结构与 API 文档一致,位于
data 字段内。 - 识别结果位于 data[0].result[0].elements 中,具体字段取决于 ocrType。
- 错误信息:如果发生错误,会输出以
错误: 开头的友好提示。
注意事项
- - 本技能调用的 OCR API 有 10 QPS 的速率限制。
- 如果遇到 429 错误,请等待 2-3 秒后重试,不要连续发起请求。
- 建议在调用前确保图片已准备就绪,避免因网络问题导致重复调用。
故障排除
| 问题 | 解决方案 |
|---|
| 配置文件不存在 | 创建 config/.env 并填入 Token(参考前置配置) |
| API Key 无效/过期 |
重新申请 Token 并更新
.env 文件 |
| 文件不存在 | 检查提供的文件路径是否正确 |
| 网络连接失败 | 检查网络连接或防火墙设置 |
| 不支持的文件类型 | 确保文件扩展名为允许的类型(参考 API 文档) |
| 401/403/Unauthorized | Token 无效或过期,重新申请并配置 |
| 429 Too Many Requests | 请求过于频繁,技能会自动等待并重试(最多 3 次)。若持续失败,请降低调用频率或联系服务方提高限额。 |
技能名称: scnet-ocr
详细描述:
曙光-Scnet 通用 OCR 技能
本技能封装了曙光-Scnet 通用 OCR 服务,通过单一接口即可调用 31 种识别能力,高效提取文字及票据信息。
功能特性
- - 通用文字识别:提取图片中的全部文字,支持横竖版及坐标定位。
- 个人证照:识别居民身份证、银行卡、社保卡、户口本、出生医学证明、往来港澳通行证、往来台湾通行证、台湾居民来往大陆通行证、港澳居民来往内地通行证。
- 行业资质:识别营业执照、社会团体法人登记证书、工会法人资格证书、宗教活动场所登记证、民办非企业单位登记证书、事业单位法人证书、统一社会信用代码证书。
- 财务票据:覆盖增值税发票、增值税卷票、出租车发票、火车票、航空运输电子客票行程单、机动车销售统一发票、定额发票、过路过桥费发票、医疗门诊发票、税收完税证明、船票、非税票据、通用机打发票、汽车票,自动提取关键字段。
前置配置
⚠️ 重要:使用前需要申请 Scnet API Token
申请 API Token
- 1. 访问 Scnet 官网 注册/登录
- 在控制台申请 API 密钥(格式:sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx)
- 复制密钥备用
配置 Token
方式一:让 AI 配置
“帮我配置 Scnet OCR,Token 是:xxx”
方式二:手动配置
- 1. 在技能目录下创建 config/.env 文件,内容如下:
ini
===== 曙光-Scnet OCR API 配置 =====
申请地址:https://www.scnet.cn
SCNET
APIKEY=your
scnetapi
keyhere
API 基础地址(一般无需修改)
SCNET
APIBASE=https://api.scnet.cn/api/llm/v1
Token 更新
Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNETAPIKEY。
使用方法
参数说明
| 参数名 | 类型 | 必填 | 描述 |
|--------|------|------|------|
| ocrType | string | 是 | 识别类型枚举。必须为以下之一:
• GENERAL(通用文字)
• IDCARD(身份证)
• BANKCARD(银行卡)
• SOCIALSECURITYCARD(社保卡)
• HOUSEHOLDREGISTER(户口本)
• BIRTHCERTIFICATE(出生医学证明)
• HKMACAUPASS(往来港澳通行证)
• TAIWANPASS(往来台湾通行证)
• TAIWANMAINLANDPASS(台湾居民来往大陆通行证)
• HKMAINLANDPASS(港澳居民来往内地通行证)
• BUSINESSLICENSE(营业执照)
• SOCIALORGREG(社会团体法人登记证书)
• TRADEUNIONREG(工会法人资格证书)
• RELIGIOUSACTIVITYREG(宗教活动场所登记证)
• PRIVATENONENTERPRISEREG(民办非企业单位登记证书)
• INSTITUTIONLEGALREG(事业单位法人证书)
• UNIFIEDSOCIALCREDITREG(统一社会信用代码证书)
• VATINVOICE(增值税发票)
• VATROLLINVOICE(增值税卷票)
• TAXIINVOICE(出租车发票)
• TRAINTICKET(火车票)
• AIRPORTTICKET(航空运输电子客票行程单)
• VEHICLESALEINVOICE(机动车销售统一发票)
• QUOTAINVOICE(定额发票)
• TOLLINVOICE(过路过桥费发票)
• MEDICALINVOICE(医疗门诊发票)
• TAXCERTIFICATE(税收完税证明)
• SHIPTICKET(船票)
• NONTAXBILL(非税票据)
• GENERALMACHINEINVOICE(通用机打发票)
• BUSTICKET(汽车票) |
| filePath | string | 是 | 待识别图片的本地绝对路径。支持 jpg、png、pdf 等常见格式。 |
命令行调用示例
bash
python .claude/skills/scnet-ocr/scripts/main.py VAT_INVOICE /path/to/invoice.jpg
在 AI 对话中使用
用户可以说:
- - “帮我识别这张身份证,图片在 /Users/name/Downloads/id.jpg”
- “提取这张发票的信息,路径是 /Users/name/Downloads/fapiao.png”
- “OCR 这个图片里的文字,图片在 /Users/name/Desktop/text.png”
AI 会根据 description 中的关键词自动触发本技能。
AI 调用建议
为避免触发 API 速率限制(10 QPS),请串行调用本技能,即等待前一个识别完成后再发起下一个请求。
如果使用 OpenClaw 的 exec 工具,建议设置 timeout 或 yieldMs 参数,让命令同步执行,避免多个命令同时运行导致并发。
配置选项
编辑 config/.env 文件:
| 变量名 | 默认值 | 说明 |
|--------|--------|------|
| SCNETAPIKEY | 必需 | Scnet API 密钥 |
| SCNETAPIBASE | https://api.scnet.cn/api/llm/v1 | API 基础地址(一般无需修改) |
输出
- - 标准输出:识别结果的 JSON 数据,结构与 API 文档一致,位于 data 字段内。
- 识别结果位于 data[0].result[0].elements 中,具体字段取决于 ocrType。
- 错误信息:如果发生错误,会输出以 错误: 开头的友好提示。
注意事项
- - 本技能调用的 OCR API 有 10 QPS 的速率限制。
- 如果遇到 429 错误,请等待 2-3 秒后重试,不要连续发起请求。
- 建议在调用前确保图片已准备就绪,避免因网络问题导致重复调用。
故障排除
| 问题 | 解决方案 |
|------|----------|
| 配置文件不存在 | 创建 config/.env 并填入 Token(参考前置配置) |
| API Key 无效/过期 | 重新申请 Token 并更新 .env 文件 |
| 文件不存在 | 检查提供的文件路径是否正确 |
| 网络连接失败 | 检查网络连接或防火墙设置 |
| 不支持的文件类型 | 确保文件扩展名为允许的类型(参考 API 文档) |
| 401/403/Unauthorized | Token 无效或过期,重新申请并配置 |
| 429 Too Many Requests | 请求过于频繁,技能会自动等待并重试(最多 3 次)。若持续失败,请降低调用频率或联系服务方提高限额。 |