返回顶部
t

turboquant-memoryTurboQuant记忆

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
127
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

turboquant-memory

TurboQuant 记忆压缩

使用 TurboQuant(Google,ICLR 2026)将嵌入向量压缩 5-8 倍,同时保持 98% 以上的搜索准确率。

快速开始

1. 运行测试

bash
python3 scripts/turboquant.py

内置 15 项测试:FWHT 正确性、MSE 失真、内积相关性、召回率、压缩比、确定性。

2. 在您的数据上验证

bash
python3 scripts/validate.py --db /path/to/memory.sqlite --auto-detect --bits 5

自动检测 sqlite-vec vec0 表,分析分布情况,报告量化质量和召回率。

3. 量化记忆数据库

bash
python3 scripts/memory_quantize.py --db /path/to/memory.db --bits 5 --benchmark
python3 scripts/memory_quantize.py --db /path/to/memory.db --bits 5 --migrate

4. 集成到代码中

python
from turboquant import TurboQuantMSE

初始化(确定性——相同种子 = 相同量化结果)

tq = TurboQuantMSE(dim=3072, bits=5)

量化存储

stored = tq.quantize(embedding_vector) # float32 → 压缩格式

重建

reconstructed = tq.dequantize(stored) # 压缩格式 → float32

搜索:查询保持 float32,数据库已量化

q_rot = tq.rotation.apply(query) for doc in database: score = doc[norm] doc[scale] np.dot(q_rot, tq.codebook[doc[indices]])

推荐配置

预设模式比特数R@1压缩比使用场景
默认MSE598%6.4x大多数记忆/RAG 搜索
保守
MSE | 6 | 98%+ | 5.3x | 高保真检索 | | 激进 | MSE | 4 | 92% | 8.0x | 大规模、存储受限场景 |

参数

参数默认值描述
dim自动检测嵌入维度(768、1536、3072 等)
bits
5 | 每个坐标的比特数。参见上表。 | | seed | 42 | 旋转种子。相同种子 = 可重现的量化结果。 |

算法

分块 Hadamard 旋转 → Lloyd-Max 标量量化

  1. 1. 将向量分割成 2 的幂次方大小的块(例如,3072 = 3 × 1024)
  2. 每块:随机符号翻转 + 快速 Walsh-Hadamard 变换(完全可逆)
  3. 每向量尺度归一化
  4. 每坐标 Lloyd-Max 最优标量量化器(针对 N(0,1) 预计算码本)
  5. 将索引打包成紧凑的比特表示

关键特性:

  • - 数据无关:无需训练或校准
  • 完全可逆:旋转过程零信息损失
  • 接近最优:距离香农信息论下界仅 2.7 倍
  • 确定性:相同种子 = 相同输出

详见 references/algorithm.md

基准测试(Gemini embedding-001,3072 维,112 个向量)

比特数MSE余弦相似度R@1R@5R@10字节/向量压缩比
31.1e-50.98288%90%91%1,16010.6x
4
3.2e-6 | 0.995 | 92% | 93% | 93% | 1,544 | 8.0x | | 5 | 8.2e-7 | 0.999 | 98% | 96% | 96% | 1,928 | 6.4x | | 6 | 2.2e-7 | 1.000 | 96% | 98% | 98% | 2,312 | 5.3x | | 7 | 8e-8 | 1.000 | 100% | 98% | 99% | 2,696 | 4.6x | | 8 | 3e-8 | 1.000 | 98% | 98% | 99% | 3,080 | 4.0x |

兼容性

  • - Python 3.9+,仅需 numpy(无需 scipy,无需 GPU)
  • 任意嵌入维度 ≥ 128
  • 任意嵌入模型(Gemini、OpenAI、Cohere、sentence-transformers 等)
  • SQLite / sqlite-vec vec0 表(自动检测)

参考文献

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 turboquant-memory-1776014602 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 turboquant-memory-1776014602 技能

通过命令行安装

skillhub install turboquant-memory-1776014602

下载

⬇ 下载 turboquant-memory v2.0.0(免费)

文件大小: 23.86 KB | 发布时间: 2026-4-13 12:24

v2.0.0 最新 2026-4-13 12:24
v2: Blockwise Hadamard rotation (fixes critical SRHT subsample bug), 98% recall at 6.4x compression, numpy only, OpenClaw sqlite-vec support, distribution validation tool

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部