返回顶部
s

semantic-cache语义缓存

|

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
168
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

semantic-cache

语义缓存

使用Redis向量搜索按语义缓存LLM响应。相似的问题可直接返回缓存的答案,无需进行昂贵的API调用。

工作原理

  1. 1. 用户提出问题或发起LLM请求
  2. 使用OpenAI text-embedding-3-small将问题嵌入为向量
  3. Redis向量搜索查找语义相似的已缓存查询(余弦相似度 > 0.80)
  4. 缓存命中:立即返回缓存的响应(约100毫秒)
  5. 缓存未命中:传递至LLM,缓存响应以供未来相似查询使用

命令

缓存查询和响应

bash node scripts/cache.js store 法国的首都是什么? 法国的首都是巴黎。

检查缓存的相似查询

bash node scripts/cache.js lookup 法国首都是哪个城市?

缓存统计

bash node scripts/cache.js stats

清除所有缓存条目

bash node scripts/cache.js clear

交互模式 — 为任何LLM调用添加缓存

bash node scripts/cache.js query 在此输入您的问题

此命令首先检查缓存。若未命中,则调用OpenAI,缓存结果并返回。

何时使用此技能

  • - 在进行任何LLM API调用之前,检查是否已有语义相似的查询被回答过
  • 构建回答重复性问题的智能体时(支持机器人、常见问题解答系统)
  • 希望将OpenAI/Anthropic API成本降低40-80%时
  • 需要为常见查询提供更快的响应时间时

配置

设置以下环境变量:

  • - REDISURL — 支持向量搜索的Redis连接字符串(Redis Cloud或Redis Stack)
  • OPENAIAPIKEY — 用于生成嵌入向量
  • SEMANTICCACHETHRESHOLD — 相似度阈值0-1(默认:0.80,值越高匹配越严格)
  • SEMANTICCACHE_TTL — 缓存生存时间(秒)(默认:86400 = 24小时)

示例工作流程

用户:如何重置密码?
-> 嵌入查询 -> 搜索Redis -> 未命中
-> 调用LLM -> 获取响应 -> 缓存响应 -> 返回响应

用户:我忘记密码了,如何修改?
-> 嵌入查询 -> 搜索Redis -> 命中(相似度92.7%)
-> 在8毫秒内返回缓存的响应(节省约2秒+API成本)

性能

  • - 缓存查找:约5-15毫秒(相比LLM调用的1-5秒)
  • 嵌入向量生成:约50-100毫秒
  • 每条条目存储:约6KB(1536维向量+元数据)
  • 支持数百万条缓存条目

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 semantic-cache-1776017955 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 semantic-cache-1776017955 技能

通过命令行安装

skillhub install semantic-cache-1776017955

下载

⬇ 下载 semantic-cache v1.0.0(免费)

文件大小: 13.18 KB | 发布时间: 2026-4-13 11:55

v1.0.0 最新 2026-4-13 11:55
Initial release — Redis vector search cache for LLM API calls. Cache by meaning, not exact match. 77x faster responses on cache hits.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部