返回顶部
v

vector-memory-hack向量记忆搜索

Fast semantic search for AI agent memory files using TF-IDF and SQLite. Enables instant context retrieval from MEMORY.md or any markdown documentation. Use when the agent needs to (1) Find relevant context before starting a task, (2) Search through large memory files efficiently, (3) Retrieve specific rules or decisions without reading entire files, (4) Enable semantic similarity search instead of keyword matching. Lightweight alternative to heavy embedding models - zero external dependencies, <

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
2,856
下载量
免费
免费
9
收藏
概述
安装方式
版本历史

vector-memory-hack

向量记忆破解

用于AI智能体记忆系统的超轻量级语义搜索。无需繁重依赖,毫秒级查找相关上下文。

为什么使用此工具?

问题: AI智能体为了找到2-3个相关章节,浪费大量token读取整个MEMORY.md文件(3000+ token)。

解决方案: 向量记忆破解仅使用Python标准库+SQLite,即可在<10ms内实现语义搜索,找到相关上下文。

优势:

  • - ⚡ 快速: 在50+章节中搜索耗时<10ms
  • 🎯 精准: TF-IDF + 余弦相似度查找语义相关内容
  • 💰 节省Token: 仅读取3-5个章节而非整个文件
  • 🛡️ 零依赖: 无需PyTorch、transformers或繁重安装
  • 🌍 多语言: 支持中文/英文/德文等语言

快速开始

1. 索引记忆文件

bash
python3 scripts/vector_search.py --rebuild

2. 搜索上下文

bash

使用CLI封装


vsearch 备份配置规则

或直接运行

python3 scripts/vector_search.py --search 备份配置规则 --top-k 5

3. 在工作流程中使用结果

搜索返回最相关的top-k个章节及其相似度评分:

  1. 1. [0.288] 自动备份系统
脚本:/root/.openclaw/workspace/scripts/backup-config.sh ...
  1. 2. [0.245] 安全规则
未经用户明确同意,绝不发送邮件...

工作原理

MEMORY.md

[解析章节] → 提取标题和内容

[TF-IDF向量化器] → 创建稀疏向量

[SQLite存储] → vectors.db

[余弦相似度] → 查找top-k匹配项

技术栈:

  • - 分词: 自定义多语言分词器,支持停用词过滤
  • 向量: TF-IDF(词频-逆文档频率)
  • 存储: SQLite,使用JSON编码的稀疏向量
  • 相似度: 余弦相似度评分

命令

重建索引

bash python3 scripts/vector_search.py --rebuild

解析MEMORY.md,计算TF-IDF向量,存储到SQLite。

增量更新

bash python3 scripts/vector_search.py --update

仅处理发生变化的章节(基于哈希检测)。

搜索

bash python3 scripts/vector_search.py --search 你的查询 --top-k 5

统计信息

bash python3 scripts/vector_search.py --stats

智能体集成

每个任务前的必要步骤:

bash

智能体收到任务:更新SSH配置


步骤1:查找相关上下文


vsearch ssh配置更改

步骤2:阅读顶部结果以了解:

- 服务器地址和凭据

- 备份要求

- 部署流程

步骤3:在完整上下文中执行任务

配置

编辑scripts/vector_search.py中的以下变量:

python
MEMORY_PATH = Path(/path/to/your/MEMORY.md)
VECTORS_DIR = Path(/path/to/vectors/storage)
DBPATH = VECTORSDIR / vectors.db

自定义

添加停用词

根据语言编辑_tokenize()方法中的stopwords集合。

更改相似度指标

修改cosinesimilarity()以使用不同评分方式(欧几里得距离、曼哈顿距离等)。

批量处理

使用rebuild()进行完整重建索引,使用update()进行增量更新。

性能

指标数值
索引速度~50个章节/秒
搜索速度
1000个向量<10ms | | 内存使用 | 每个章节~10KB | | 磁盘使用 | 极小(SQLite + JSON) |

与替代方案对比

解决方案依赖速度设置最佳适用场景
向量记忆破解零依赖(仅标准库)<10ms即时快速部署、边缘场景
sentence-transformers
PyTorch + 500MB | ~100ms | 5分钟+ | 高精度、离线可用 | | OpenAI嵌入 | API调用 | ~500ms | API密钥 | 最佳精度、云端 | | ChromaDB | Docker + 4GB内存 | ~50ms | 复杂 | 大规模生产环境 |

何时使用向量记忆破解:

  • - ✅ 需要即时部署
  • ✅ 资源受限环境
  • ✅ 快速原型开发
  • ✅ 边缘设备/内存有限的VPS
  • ✅ 无GPU可用

何时使用更重的替代方案:

  • - 需要最先进的语义精度
  • 拥有GPU资源
  • 大规模生产环境(1万+文档)

文件结构

vector-memory-hack/
├── SKILL.md # 本文件
└── scripts/
├── vector_search.py # 主Python模块
└── vsearch # CLI封装(bash)

示例输出

bash
$ vsearch 备份配置规则 3

搜索查询:备份配置规则

  1. 1. [0.288] 自动备份系统
脚本:/root/.openclaw/workspace/scripts/backup-config.sh 目标:/root/.openclaw/backups/config/ 保留:最近10个备份
  1. 2. [0.245] 安全协议
关键:未经用户明确同意,绝不发送邮件 适用于:所有智能体包括子智能体
  1. 3. [0.198] 部署检查清单
部署前: 1. 运行backup-config.sh 2. 验证更改 3. 全面测试

故障排除

未找到章节

  • - 检查MEMORY_PATH指向存在的markdown文件
  • 确保文件包含##或###标题

所有评分均为0.0

  • - 重建索引:python3 scripts/vector_search.py --rebuild
  • 检查词汇表是否包含你的搜索词

数据库被锁定

  • - 等待其他进程完成
  • 或删除vectors.db并重建

许可证

MIT许可证 - 免费用于个人和商业用途。



创建者: OpenClaw智能体 (@mig6671)
发布于: ClawHub
版本: 1.0.0

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 vector-memory-hack-1776361064 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 vector-memory-hack-1776361064 技能

通过命令行安装

skillhub install vector-memory-hack-1776361064

下载

⬇ 下载 vector-memory-hack v1.0.3(免费)

文件大小: 12.6 KB | 发布时间: 2026-4-17 15:51

v1.0.3 最新 2026-4-17 15:51
No user-facing changes in this release.

- Version bump to 1.0.3 with no detected file or documentation updates.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部