返回顶部
C

Compress语义压缩

Compress text semantically with iterative validation, anchor checksums, and verified information preservation.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
869
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

Compress

⚠️ 重要限制

这是语义压缩,而非比特级无损压缩。

  • - L1-L2:已验证可重建,可投入生产使用
  • L3-L4:实验性功能,可能丢失细微信息
  • 切勿用于: 医疗剂量、法律文本、财务数据、安全关键信息



验证循环

  1. 1. 压缩原始内容 O → 压缩后内容 C
  2. 从 O 中提取锚点(实体、数字、日期)
  3. 重建 C → R(不参考 O)
  4. 验证:锚点匹配 + 语义差异
  5. 若不匹配 → 补充缺失信息后优化 C
  6. 重复直至验证通过(最多 3 次迭代)

收敛 = 验证通过。3 轮后仍未收敛 = 压缩级别过高。



快速参考


任务参考文件
压缩级别(L1-L4)levels.md
验证算法详情
validation.md |
| 特定格式策略 | formats.md |
| Token 预算与指标 | metrics.md |


压缩级别


级别压缩比可靠性适用场景
L1~0.8x✅ 高生产环境,人类可读
L2
~0.5x | ✅ 良好 | 系统提示词,重复使用 |
| L3 | ~0.3x | ⚠️ 中等 | 实验性质,需审查输出 |
| L4 | ~0.15x | ⚠️ 低 | 仅限研究,预期有损失 |


锚点校验系统

压缩前,提取关键事实:

[锚点:3 人,42,000 美元,2024-03-15,阿尔法项目]

重建结果必须精确复现上述内容。锚点不匹配 → 压缩失败。



核心规则

  1. 1. 始终验证 — 未经重建测试,切勿信任压缩结果
  2. 使用锚点 — 压缩前提取数字、名称、日期
  3. 生产环境上限为 L2 — L3-L4 为实验性质
  4. 报告置信度 — 包含迭代次数和锚点匹配率
  5. 独立验证 — 可考虑使用不同模型进行重建

成本效益分析

每次压缩消耗 3-4 次 LLM 调用。盈亏平衡计算:

盈亏平衡检索次数 = 压缩消耗的 Token / 每次使用节省的 Token

仅在以下情况具有成本效益: 你将检索压缩内容 6-8 次以上。

一次性使用 → 直接使用原始文本。



压缩前检查清单

  • - [ ] 内容类型不属于安全关键信息
  • [ ] 已选择目标级别(推荐 L1-L2)
  • [ ] 已识别锚点(数字、名称、日期)
  • [ ] 投资回报率合理(预期多次检索)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 compress-1776419982 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 compress-1776419982 技能

通过命令行安装

skillhub install compress-1776419982

下载

⬇ 下载 Compress v1.0.0(免费)

文件大小: 7.2 KB | 发布时间: 2026-4-17 18:16

v1.0.0 最新 2026-4-17 18:16
Initial release

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部