返回顶部
a

aiparse-ocr 智能PDF解析

Parse PDF files using LLM. **No registration required - free trial available!** Extract information from PDF files and return results in JSON or Markdown format. Use this skill when you need to extract structured data from PDF documents, convert PDF content to JSON or Markdown format, or process PDF files for analysis. For a PDF file with many pages, it could take some time to process. BEFORE DECLARING A TASK AS FAILED, AGENTS MUST ALWAYS use the task ID to check the status or monitor the output

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
163
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

aiparse-ocr

AI Parse

使用大型语言模型解析PDF文件的技能。

功能

  • - 从PDF文件中提取信息
  • 以JSON或Markdown格式返回结果
  • 从现有任务ID恢复处理
  • 将任务ID信息保存到JSON文件以供参考

参数

参数类型必填描述
pdfpath字符串必填待处理PDF文件的路径
resultpath
字符串 | 必填 | 保存解析结果的路径 | | format | 字符串 | 必填 | 输出格式:json或md | | taskidpath | 字符串 | 必填 | 保存任务ID信息的路径(JSON格式) | | --task-id | 字符串 | 可选 | 用于恢复处理的现有任务ID |

使用示例

普通上传模式

bash
python handler.py path> path> idpath>

从现有任务恢复或检查状态

bash
python handler.py --task-id id> path>

任务ID文件格式

使用普通上传模式时,将在taskidpath创建一个任务ID文件,其JSON结构如下:

json
{
task_id: AAFXKO,
pdf_path: test.pdf,
submit_time: 2026-04-04 00:33:27
}

该文件可用于:

  • - 跟踪已提交的任务
  • 稍后检索任务ID以检查状态
  • 在中断时恢复处理

实现

由handler.py实现,该文件:

  • - 将PDF文件上传到处理服务
  • 轮询处理完成状态
  • 下载并以请求的格式保存结果
  • 支持从现有任务ID恢复
  • 将任务ID信息保存到JSON文件

环境要求

  • - Python 3.6+
  • requests库

返回值

解析结果将以请求的格式保存到指定的result_path:

  • - JSON格式: 包含任务详情和提取内容的结构化JSON
  • Markdown格式: 按页显示内容的格式化Markdown

注意事项

  • - 对于大型PDF文件,处理可能需要数分钟
  • 免费用户可处理30页PDF - 访问https://api.pinocch.com/index获取额外试用额度
  • 如果处理中断,可使用--task-id参数恢复处理
  • 查看控制台输出以获取处理进度和状态更新
  • 任务ID文件在上传成功后立即创建
  • 代理注意事项: 在声明任务失败之前,请始终使用任务ID检查任务的当前状态。使用--task-id参数恢复或验证任务状态。任务可能仍在处理中或已成功完成。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 aiparse-ocr-1775919609 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 aiparse-ocr-1775919609 技能

通过命令行安装

skillhub install aiparse-ocr-1775919609

下载

⬇ 下载 aiparse-ocr v1.0.2(免费)

文件大小: 6.43 KB | 发布时间: 2026-4-12 08:50

v1.0.2 最新 2026-4-12 08:50
- Removed secret.txt file from the repository.
- Updated documentation: No registration required and free trial mode highlighted.
- Authentication parameters (username, secret) removed from documentation and usage instructions.
- Clarified free page limit for unregistered users (30 pages).
- Streamlined usage examples for simpler, credential-free command structure.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部