返回顶部
p

pdf-master-translatorPDF多智能体翻译

A highly robust, multi-agent pipeline for translating and reconstructing complex, image-heavy, or scanned PDF documents (especially engineering, scientific, or military specs). Use this skill when dealing with PDFs that contain complex layouts, dense tables, mathematical formulas (LaTeX), or when previous translation attempts resulted in broken layouts, missing figures, "hallucinated" translations, or corrupted text. It uses a "mask-and-fill" approach, holographic context injection, and SVG math

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
217
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

pdf-master-translator

PDF 大师翻译器(V10 架构)

本技能提供了一套经过实战检验、坚不可摧的复杂PDF文档翻译流程。该流程源自对NASA工程规范的大量试错经验。

切勿尝试对复杂工程文档使用简单的OCR或零样本LLM翻译。 这些方法会失败。请使用本技能提供的 translatorenginev10.py 脚本。

核心能力与V10流程

本技能依赖于一个Python脚本(scripts/translatorenginev10.py),该脚本实现了一个特定的多智能体工作流程:

  1. 1. 布局与物理隔离(遮罩):
- 切勿要求LLM在杂乱的扫描件上忽略图片并翻译文字。 - 流程首先检测图形和表格。 - 它在临时图像上物理性地将这些区域涂白(遮罩)。 - 将干净的图像发送进行翻译,消除视觉幻觉。 - 原始图形被提取、转换为Base64,并安全地附加到最终的HTML/PDF中。
  1. 2. 全息上下文注入:
- 遮罩会在被遮罩区域周围产生碎片化的句子。 - 为防止翻译智能体产生脱离上下文或支离破碎的翻译,流程将整页的原始、未格式化的文本流作为参考字典注入。智能体利用此上下文无缝衔接视觉上的空白区域。
  1. 3. 协议降级(XML优于JSON):
- 强制LLM在严格的JSON结构中输出数千字的Markdown是脆弱的,且容易产生转义错误。 - 引擎强制执行简单的XML标签(
、、
)进行结构路由。
  1. 4. 严格的数学与符号渲染:
- 标准的PDF渲染器(如WeasyPrint)无法执行JavaScript(MathJax)。 - 脚本使用正则表达式拦截所有LaTeX($...$ 或 $$...$$),并调用外部API(math.vercel.app)将其渲染为高质量、可嵌入的SVG图像。 - 提示词严格规定符号词汇表使用 $变量$:描述 格式,以确保视觉一致性。
  1. 5. 终端防御(完整性清理器):
- 生成PDF前的最后一步是进行正则表达式扫描,以移除任何可能逃逸流程的泄露LLM伪影(如 markdown 包装器)或错误占位符(如 RetryError[])。

使用说明

要使用本技能,请执行 translatorenginev10.py 脚本。

前提条件

确保已安装所需的依赖项(如果使用内联元数据,通常通过 uv run 处理),并设置好Gemini API密钥。

bash
export GEMINIAPIKEY=yourapikey_here

如果您的网络需要代理:


export HTTPS_PROXY=http://127.0.0.1:10809

执行

运行脚本,提供目标PDF的路径和具体的页码范围。

bash
uv run ~/.npm-global/lib/nodemodules/openclaw/skills/pdf-master-translator/scripts/translatorengine_v10.py /path/to/target.pdf --start <起始页> --end <结束页>

重要操作规则:

  • - 始终明确指定 --start 和 --end。
  • 对于非常大的文档(超过20页),强烈建议使用 nohup ... & 在后台运行,因为多智能体交叉检查和API速率限制的休眠周期会使此过程耗时较长。

输出

脚本将在当前工作目录中生成一个名为 [原始文件名]V10FINAL_P[起始页]-[结束页].pdf 的新PDF。

此PDF将具有以下特点:

  • - 清晰的 --- 第 X 页 --- 分隔符,便于连续阅读。
  • 一致的页眉和页脚Markdown表格。
  • SVG渲染的数学公式。
  • 相关页面底部有专门的 [ 原文图表/示意图 ] 部分,包含提取的原始图表。
  • (如适用)包含图表内文字翻译的 [ 图例符号说明 ] 部分。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 pdf-master-translator-1776205933 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 pdf-master-translator-1776205933 技能

通过命令行安装

skillhub install pdf-master-translator-1776205933

下载

⬇ 下载 pdf-master-translator v1.0.0(免费)

文件大小: 37.79 KB | 发布时间: 2026-4-17 15:43

v1.0.0 最新 2026-4-17 15:43
Initial release of V10 architecture featuring masking, holographic context, SVG math, and terminal defense for complex engineering documents.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部