返回顶部
l

local-ai-search本地AI搜索

Natural language search for local files (100G-1T). Supports xlsx, pptx, pdf, docx formats with location info. Triggered when user asks to search local/computer/folder content.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.4.0
安全检测
已通过
149
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

local-ai-search

Local AI Search

触发条件

当用户说以下内容时,调用此 Skill:

  • - 帮我在本地搜索...
  • 帮我在本电脑搜索...
  • 帮我在某个文件夹中搜索...
  • 搜索本地文件...
  • 搜索我的文档...
  • 在本机查找...
  • 从我的文件中查找...
  • 或任何涉及本地/本机/文件夹内容检索的请求

功能说明

本 Skill 提供本地文件的 AI 智能搜索功能:

  • - ✅ 支持 xlsx, pptx, pdf, docx, md 等格式
  • ✅ 自然语言查询(用日常语言描述要找的内容)
  • ✅ 指定文件夹范围进行搜索
  • ✅ 返回文件位置信息(工作表名、幻灯片页码)
  • ✅ 无需本地大模型,使用云端 API

使用方式

方式一:直接搜索(推荐)

用户: 帮我在本地搜索关于销售数据的内容
用户: 在 ~/Documents/Projects 文件夹中搜索 API 相关的文档
用户: 搜索本电脑中包含关键词的文件

方式二:指定目录搜索

用户: 帮我在 ~/Documents/Projects 文件夹中搜索技术文档

方式三:自然语言查询

用户: 帮我找一下第三季度的销售报告
用户: 搜索一下关于数字化转型的内容
用户: 找找看有没有关于项目计划的 PPT

调用流程

  1. 1. 检查服务状态:确认 Khoj 服务是否运行
  2. 确定搜索范围:用户指定的文件夹,或默认已索引的知识库
  3. 执行搜索:使用自然语言查询本地文件
  4. 返回结果:显示匹配的文件名、位置信息、内容片段

快速验证(已测试)

bash

1. 启动 Khoj 服务(嵌入式 PostgreSQL 模式)


export USEEMBEDDEDDB=true
khoj --anonymous-mode

2. 转换文档

~/.agents/skills/local-ai-search/scripts/convert.py ~/Documents/source -o ~/Documents/converted

3. 索引文件(API 方式)

curl -X PATCH http://localhost:42110/api/content \ -F files=@~/Documents/converted/example.xlsx.md

4. 搜索查询

~/.agents/skills/local-ai-search/scripts/query.py 搜索内容

验证结果示例

[1] 文件: test_data.xlsx.md
工作表: Sales Data
内容: | Month | Sales | | January | $10,000 |...

[2] 文件: test_slides.pptx.md
幻灯片: 第 1 页
内容: # Project Overview This is a test presentation...



概述

基于 Khoj 的本地 RAG 知识库解决方案,支持大规模文件(100G到1T)的全文检索和自然语言查询。通过 MarkItDown 转换 Office 文档,结合云端 LLM API 实现轻量级部署,适合资源受限环境。



需求背景

核心需求

需求项具体要求
数据规模建议小于1T的数据量,例如200GB 本地文件
文件格式
xlsx, pptx, pdf, docx, md 等 | | 检索方式 | 自然语言查询 | | 大模型 | 云端 API(OpenAI/DeepSeek/Claude/Qwen/Kimi/Minmax) | | 定位精度 | 来源文件 + 大致位置(工作表/幻灯片) | | 集成方式 | 封装为 OpenCode Skill |

硬件约束

约束项配置
设备常规个人PC,例如MacBook Air M2
内存
8GB+ 可用内存 | | 剩余空间 | 足够的磁盘空间(文档大小的 25-40%)。例如200G的文件,需要有80GB空闲空间,支持本地向量数据库存储RAG结果。 | | 本地 LLM | 无法部署(资源不足) |

技术架构

架构图

┌─────────────────────────────────────────────────────────────────┐
│ OpenCode Skill │
│ rag query 搜索内容 --top-k 10 │
│ rag index /path/to/files │
│ rag status │
└─────────────────────────┬───────────────────────────────────────┘


┌─────────────────────────────────────────────────────────────────┐
│ Khoj API Server │
│ localhost:42110 │
│ • 向量检索 │
│ • 对话生成 │
│ • 文件管理 │
└─────────────────────────┬───────────────────────────────────────┘

┌───────────────┴───────────────┐
▼ ▼
┌─────────────────────┐ ┌─────────────────────┐
│ PostgreSQL 数据库 │ │ 云端 LLM API │
│ (嵌入式 pgserver) │ │ 多模型支持 │
│ • 向量存储 │ │ • Chat Model │
│ • 文档索引 │ │ • 对话生成 │
│ • ~50-80GB │ │ • 无本地占用 │
└─────────────────────┘ └─────────────────────┘

数据流

xlsx/pptx → MarkItDown 转换 → Markdown → Khoj 索引 → 向量数据库

用户查询 → 向量检索 → 匹配片段 → 云端 LLM → 自然语言回答

显示来源文件 + 位置

组件说明

组件选择理由
RAG 服务Khoj成熟(33k stars)、API 友好、内存占用低
文档转换
MarkItDown | 微软开源、支持 xlsx/pptx、保留位置信息 | | 向量数据库 | PostgreSQL(嵌入式) | 成熟稳定、pgvector 向量索引、8GB+ RAM 友好 | | Embedding | 本地模型(sentence-transformers) | 免费、快速、隐私保护 | | LLM | 云端 API | 解放内存压力、性能更好 |

安装部署

环境要求

  • - Python 3.10+
  • macOS / Linux / Windows
  • 建议 8GB+ 可用内存
  • 足够的磁盘空间(文档大小的 25-40%)

平台支持

平台支持状态说明
macOS✅ 完全支持原生支持,直接使用
Linux
✅ 完全支持 | 原生支持,直接使用 | | Windows | ⚠️ 需要 WSL2 | 使用 WSL2 运行 Linux 环境 |

Windows 用户:安装 WSL2

WSL2(Windows Subsystem for Linux 2)让 Windows 可以直接运行 Linux,无需虚拟机或双系统。

powershell

1. 在 Windows PowerShell(管理员模式)中运行


wsl --install

2. 重启电脑后,打开 Ubuntu 应用

3. 在 Ubuntu 终端中继续以下安装步骤

安装 WSL2 后,在 Ubuntu 终端中执行所有后续命令。

安装步骤

1. 安装依赖

bash

安装 Khoj


pip install khoj

安装 MarkItDown(含 Office 文档支持)

pip install markitdown[xlsx,pptx]

2. 配置云端 LLM API

bash

OpenAI


export OPENAIAPIKEY=sk-xxx

DeepSeek(推荐,性价比高)

export OPENAIAPIKEY=sk-xxx export OPENAIBASEURL=https://api.deepseek.com/v1

Anthropic Claude

export ANTHROPICAPIKEY=sk-xxx

3. 启动 Khoj 服务

bash

嵌入式 PostgreSQL 模式(推荐个人使用)


export USEEMBEDDEDDB=true
khoj --anonymous-mode

访问 Web UI

open http://localhost:42110

使用指南

命令列表

命令说明示例
rag start启动 Khoj 服务rag start
rag stop
停止服务 | rag stop | | rag status | 查看服务状态 | rag status | | rag convert | 转换 xlsx/pptx 为 Markdown | rag convert ~/Documents | | rag index | 索引文件到知识库 | rag index ~/Documents/converted | | rag query <问题> | 查询知识库 | rag query

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 local-ai-search-1776126013 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 local-ai-search-1776126013 技能

通过命令行安装

skillhub install local-ai-search-1776126013

下载

⬇ 下载 local-ai-search v1.4.0(免费)

文件大小: 27.33 KB | 发布时间: 2026-4-14 09:47

v1.4.0 最新 2026-4-14 09:47
feat: add local OCR support for scanned PDFs and .doc file format

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部