返回顶部
c

ca-file-processor文件处理器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
153
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ca-file-processor

CA文件处理器

本技能可处理印度CA事务所常用的四种文件格式,并从中提取结构化信息,用于分析、汇总和解答查询。

支持的格式

  • - PDF — GST申报表、ITR确认函、审计报告、扫描发票(含文本层及通过OCR扫描的发票)
  • Excel(.xlsx / .xls) — 试算平衡表、损益表、资产负债表、工资登记簿、GST计算表
  • CSV — 银行对账单导出文件(HDFC、ICICI、SBI)、GSTR-2B下载文件、Tally导出文件
  • 图片(.jpg / .png) — WhatsApp发票照片、扫描版Form 16、支票图像

使用方法

当文件被附加或上传时,运行相应的脚本:

python3 scripts/skill_router.py <文件路径>

路由器会自动检测文件类型并调用正确的处理器。它将返回结构化的JSON字典。

输出处理方式

脚本返回输出后,请使用该输出:

  1. 1. 回答用户关于文档的问题
  2. 提取用户要求的特定字段(GSTIN、总额、日期)
  3. 用通俗语言总结文档内容
  4. 标记异常或缺失信息
  5. 跨多个文档比较数据

字段提取 — 自动检测内容

针对发票和PDF:

  • - GSTIN(供应商和接收方)
  • 发票编号和日期
  • 总金额/合计
  • PAN号码
  • 电子邮箱和电话号码

针对银行对账单(CSV):

  • - 总借方和总贷方
  • 交易日期范围
  • 检测到的银行格式

针对Excel文件:

  • - 文档类型(试算平衡表/损益表/资产负债表/工资登记簿/GST计算表/分类账)
  • 工作表名称和行数
  • 标题行预览

OCR说明

  • - 文本层PDF直接读取(快速、准确)
  • 扫描版PDF和图片通过Tesseract OCR处理(英语+印地语)
  • 输出结果中标注置信度为高/中/低
  • 始终向用户标记低置信度结果,并要求对数字字段进行确认

信任声明

本技能完全在您的服务器本地运行。不会向任何外部服务发送数据。所有处理均通过开源Python库(PyMuPDF、pytesseract、openpyxl、pandas)完成。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ca-file-processor-1775931501 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ca-file-processor-1775931501 技能

通过命令行安装

skillhub install ca-file-processor-1775931501

下载

⬇ 下载 ca-file-processor v1.0.3(免费)

文件大小: 19.01 KB | 发布时间: 2026-4-12 09:17

v1.0.3 最新 2026-4-12 09:17
Update skill.md

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部