返回顶部
s

smart-code-search智能代码搜索

Search code and docs by meaning, not keywords. Powered by ColGREP/NextPlaid, #1 on MTEB Code. 17M params, local CPU, sub-second, zero cost, 100% private. Outperforms 8B models at 54x smaller. Use when searching codebases for implementations or patterns, navigating unfamiliar projects, finding related docs across repos, or giving coding agents semantic awareness. Triggers on "search the code", "find where", "semantic search", "code search", "smart search", "codebase search", "find implementation"

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
116
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

smart-code-search

智能代码搜索

按含义搜索代码和文档,而不仅仅是字符串。

由 LightOn 的 ColGREPNextPlaid 提供支持——这是 MTEB 排名第一的代码检索模型BrowseComp-Plus(OpenAI 最难的智能体搜索基准测试)排名第一的检索器背后的引擎。

grep 查找字符串。本工具查找意图。搜索支付捕获逻辑会从从未包含这些确切单词的文件中获取结果——因为它理解你的代码做什么,而不仅仅是它说什么。

为什么存在

每个开发者都遇到过这种情况:你知道要找什么,但不知道它在哪里。你连续尝试 4 次不同的 grep -r,猜测文件名,在目录树中滚动。编码智能体更糟糕——它们使用 grep,遗漏内容,幻觉文件路径,浪费 token 盲目探索。

ColGREP 通过多向量语义搜索解决了这个问题。它使用 Tree-sitter 解析你的代码,用 token 级向量嵌入每个函数/方法/类,并按含义对结果排序。该模型有 1700 万参数,在 CPU 上运行,并在不到一秒内返回结果。

数据

指标数值
MTEB 代码排行榜#1 (LateOn-Code)
BrowseComp-Plus
87.59% 准确率,击败所有高达 8B 参数的模型 (博客) | | 与编码智能体中的 grep 对比 | 70% 胜率正面交锋 | | 模型大小 | 1700 万参数——比竞争的 8B 模型小 54 倍 | | 搜索延迟 | CPU 上 200–900ms | | API 成本 | $0。永远免费。100% 本地运行 | | 隐私 | 代码永远不会离开你的机器 |

安装

bash
brew install lightonai/tap/colgrep

验证:colgrep --version

快速开始

1. 索引你的项目

bash
cd /path/to/project
colgrep init

就这样。ColGREP 使用 Tree-sitter 解析每个文件,在 CPU 上构建多向量嵌入,并将索引存储在 .colgrep/ 中。对于约 1000 个文件需要 30–60 秒。之后,索引在每次搜索时自动更新——更改的文件会被检测并自动重新索引。

2. 搜索

bash
colgrep 你想要的自然语言描述

结果按语义相关性分数排序。分数越高 = 匹配越好。

示例:
bash
colgrep 认证中间件令牌验证
colgrep 数据库迁移回滚策略
colgrep 带错误显示的 React 表单验证
colgrep 带指数退避的 Webhook 重试逻辑

3. 结合正则表达式 + 语义

先按正则表达式模式过滤文件,然后按语义排序:

bash
colgrep -e async.*await 错误处理模式
colgrep -e def test_ 支付捕获边界情况
colgrep -e \.tsx$ 患者仪表板布局

搜索选项

bash
colgrep 查询 # 默认输出:文件:行号 (分数: X.XX)
colgrep 查询 --json # JSON 输出,用于管道传输到其他工具
colgrep 查询 -n 5 # 仅前 5 个结果

何时使用本工具 vs grep

你知道...使用
确切的字符串或函数名grep -r functionName
概念但不知道单词
colgrep 它做什么 | | 一个模式 + 一个概念 | colgrep -e 模式 含义 | | 某物在哪里实现 | colgrep 行为描述 | | 一个功能如何跨文件工作 | colgrep 功能工作流 |

编码智能体集成

ColGREP 提供与流行编码智能体的内置集成。安装后,重启你的智能体以启用语义搜索:

  • - Claude Code: colgrep --install-claude-code
  • OpenCode: colgrep --install-opencode
  • Codex: colgrep --install-codex

这些命令将 ColGREP 注册为智能体内的搜索工具。智能体在导航已索引项目时将自动使用语义搜索。

多项目设置

独立索引每个项目。从项目目录搜索:

bash
cd ~/code/api && colgrep init
cd ~/code/frontend && colgrep init
cd ~/code/infrastructure && colgrep init
cd ~/docs && colgrep init

独立搜索每个项目

cd ~/code/api && colgrep 支付处理服务 cd ~/code/frontend && colgrep 结账表单验证

适用于单体仓库、微服务、文档库以及任何包含文本/代码文件的目录。

工作原理

ColGREP 使用 ColBERT 后期交互检索——一种与传统单向量嵌入根本不同的方法:

  1. 1. Tree-sitter 将你的代码解析为结构化单元(函数、方法、类、签名)
  2. LateOn-Code-edge(1700 万参数)为每个代码单元创建多个 token 级嵌入——而不是一个有损的摘要向量
  3. NextPlaid 将这些存储在量化的、内存映射的 Rust 索引中
  4. 在搜索时,查询 token 与文档 token 交互,进行细粒度相关性评分

这就是为什么 1700 万参数的模型能击败 8B 模型——后期交互保留了单向量方法压缩掉的 token 级语义。阅读完整技术故事:臃肿检索器时代已经结束

解读分数

  • - 6.0+ — 近乎精确的概念匹配。代码完全按照你的描述工作。
  • 5.0–6.0 — 强语义匹配。高度相关的代码。
  • 4.0–5.0 — 良好匹配。值得审查的相关代码。
  • 3.0–4.0 — 弱匹配。可能相关也可能不相关。
  • 低于 3.0 — 可能是噪声。忽略这些结果。

故障排除

索引正在被另一个进程更新 — 另一个 colgrep 实例正在更新。当前搜索使用现有索引。可以安全忽略。

从头重新索引:
bash
rm -rf .colgrep/ && colgrep init

添加到 .gitignore:

.colgrep/

链接

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 smart-code-search-1776002232 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 smart-code-search-1776002232 技能

通过命令行安装

skillhub install smart-code-search-1776002232

下载

⬇ 下载 smart-code-search v1.0.2(免费)

文件大小: 5.66 KB | 发布时间: 2026-4-13 12:05

v1.0.2 最新 2026-4-13 12:05
- Simplified and clarified the description for improved readability.
- Emphasized key features: semantic search, local CPU, zero cost, privacy, and outperforming larger models.
- Made language in the description and triggers more concise.
- No code or functionality changes; documentation update only.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部