返回顶部
b

byted-bytehouse-multimodal-searchByteHouse多模态检索

ByteHouse 多模态检索 Skill,支持文本、图片、视频的向量化存储和混合检索。当用户需要在ByteHouse数据库中进行多模态向量化存储和混合检索时,使用此Skill。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
87
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

byted-bytehouse-multimodal-search

ByteHouse 多模态检索 Skill

🚀 快速开始

环境准备

bash
pip install clickhouse-connect volcengine-python-sdk[ark] numpy

环境变量配置

优先从环境变量读取配置,禁止硬编码明文敏感信息: bash

ByteHouse 配置

export BYTEHOUSE_HOST=<你的ByteHouse连接地址> export BYTEHOUSE_PORT= export BYTEHOUSE_USER= export BYTEHOUSE_PASSWORD= export BYTEHOUSE_DATABASE=<默认数据库,可选,默认default> export BYTEHOUSE_SECURE=<是否启用加密,可选,默认true>

火山引擎方舟 API 配置

export ARKAPIKEY=<火山引擎方舟API密钥> export ARKBASEURL=https://ark.cn-beijing.volces.com/api/v3 export EMBEDDING_MODEL=doubao-embedding-vision-251215 export EMBEDDING_DIMENSIONS=1536 # 可选,默认1536

如果环境变量未配置,会自动提示用户输入。



📚 核心能力

1. 多模态向量化

基于豆包多模态向量化模型 doubao-embedding-vision-251215:

输入类型支持格式最大限制
文本纯文本字符串无长度限制
图片
JPG/PNG/GIF/WEBP/BMP | <10MB,宽高>14px |
| 视频 | MP4/AVI/MOV | <50MB |

关键约束

  • - 多模态向量化必须调用 /embeddings/multimodal 接口
  • 图片/视频输入格式:{type: imageurl, imageurl: {url: xxx}}
  • 部分模型不支持 dimensions 参数

2. 向量检索功能

功能方法说明
纯向量检索vectorsearch()基于向量相似度检索
混合检索
hybridsearch() | 向量+全文检索融合 | | 以文搜图 | textsearchimage() | 文本搜索图片 | | 以图搜图 | imagesearchimage() | 图片搜索相似图片 | | 以文搜视频 | textsearchvideo() | 文本搜索视频 |

📖 代码实现

完整示例代码实现位于 scripts/ 目录:

快速使用

python
from scripts import ByteHouseMultimodalSearch

初始化客户端

search = ByteHouseMultimodalSearch(connection_type=http)

创建表

search.createmultimodaltable(my_index)

插入文档

search.insertdocument(myindex, docid=1, contenttype=text, content=ByteHouse 多模态检索, title=介绍)

向量检索

results = search.vectorsearch(myindex, queryembedding=embedding, topk=10)

⚙️ 最佳实践

索引选择

数据规模索引类型适用场景
<100万HNSW中小规模,低延迟
100万-1亿
HNSW_SQ | 大规模,平衡性能成本 | | >1亿 | IVFPQFS | 超大规模 |

性能优化

sql
SETTINGS
index_granularity = 1024,
indexgranularitybytes = 0,
enablevectorindex_preload = 1

指令优化

场景Query 侧指令
通用文搜图Targetmodality: image. Instruction:根据文本描述找到对应的图片.
电商商品检索
Targetmodality: image. Instruction:找到和描述匹配的同款商品图片. | | 原图检索 | Target_modality: image. Instruction:查找和本图完全相同的图片. |

❓ 常见问题

Q1: 向量维度怎么选?

  • - 推荐 1536 维作为通用值
  • 维度越高精度越高,但成本也越高

Q2: 如何处理低召回问题?

  1. 1. 增大 hnswefs 参数

Q3: API 调用失败排查

  • - 404: 检查路径是否为 /embeddings/multimodal
  • 400: 检查输入格式,部分模型不支持 dimensions
  • 401: 检查 ARKAPIKEY 是否正确
  • 429: 降低请求频率



🔗 参考文档

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 byted-bytehouse-multimodal-search-1776005169 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 byted-bytehouse-multimodal-search-1776005169 技能

通过命令行安装

skillhub install byted-bytehouse-multimodal-search-1776005169

下载

⬇ 下载 byted-bytehouse-multimodal-search v1.0.0(免费)

文件大小: 12.29 KB | 发布时间: 2026-4-13 09:36

v1.0.0 最新 2026-4-13 09:36
ByteHouse 多模态检索 Skill 首次发布,支持文本、图片、视频的向量化存储与混合检索:

- 支持通过环境变量安全配置 ByteHouse 与火山引擎方舟 API 参数。
- 提供多模态向量化能力,兼容文本、主流图片及视频格式。
- 实现多模态检索方法,包括向量检索、混合检索、以文搜图/视频、以图搜图。
- 附带示例代码及核心模块入口,便于快速集成使用。
- 提供索引/性能优化建议及常见问题解答。

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部