返回顶部
R

Ragaai CatalystRagaai催化剂

Python SDK for Agent AI Observability, Monitoring and Evaluation Framework. Includes features like a ragaai catalyst, python, agentic-ai.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
168
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Ragaai Catalyst

技能名称: Ragaai Catalyst

详细描述:

检索增强生成评估器

AI驱动的RAG(检索增强生成)评估工具包。通过命令行配置、基准测试、比较和优化您的RAG管道。跟踪提示词、评估、微调实验、成本和使用情况——全部通过持久化本地日志记录和完整导出功能实现。

命令

运行 rag-evaluator <命令> [参数] 即可使用。

命令描述
configure配置RAG评估设置和参数
benchmark
对RAG管道运行基准测试 |
| compare | 比较不同RAG配置的结果 |
| prompt | 记录和管理提示词模板及其变体 |
| evaluate | 评估RAG输出质量和相关性 |
| fine-tune | 跟踪微调实验和参数 |
| analyze | 分析评估结果并识别模式 |
| cost | 跟踪和记录API/推理成本 |
| usage | 监控令牌使用量和API调用量 |
| optimize | 记录优化策略和结果 |
| test | 针对RAG配置运行测试用例 |
| report | 生成评估报告 |
| stats | 显示所有类别的汇总统计信息 |
| export <格式> | 以json、csv或txt格式导出数据 |
| search <搜索词> | 在所有记录条目中搜索 |
| recent | 显示历史日志中的最近活动 |
| status | 健康检查——版本、数据目录、磁盘使用情况 |
| help | 显示帮助信息和可用命令 |
| version | 显示版本号(v2.0.0) |

每个领域命令(configure、benchmark、compare等)有两种工作模式:

  • - 无参数:显示该类别最近20条记录
  • 带参数:将输入内容连同时间戳一起记录并保存到类别日志文件中

数据存储

所有数据本地存储在 ~/.local/share/rag-evaluator/ 目录下:

  • - 每个命令创建自己的日志文件(例如 configure.log、benchmark.log)
  • 统一的 history.log 文件跟踪所有命令的活动
  • 条目以 时间戳|值 的竖线分隔格式存储
  • 支持JSON、CSV和纯文本格式导出

系统要求

  • - Bash 4+,启用 set -euo pipefail 严格模式
  • 标准Unix工具:date、wc、du、tail、grep、sed、cat
  • 无需外部依赖或API密钥

使用场景

  1. 1. 评估RAG管道质量——记录评估分数,比较检索策略,并跟踪随时间推移的改进
  2. 对不同配置进行基准测试——针对嵌入模型、分块大小或检索方法运行基准测试,并并排比较结果
  3. 跟踪成本和使用情况——监控各实验的API成本和令牌使用量,确保不超出预算
  4. 管理提示词工程——记录提示词变体,针对管道进行测试,并分析哪些模板表现最佳
  5. 为利益相关者生成报告——将评估数据导出为JSON/CSV格式用于仪表板,或生成总结RAG性能的文本报告

示例

bash

配置新的评估运行


rag-evaluator configure model=gpt-4 chunks=512 overlap=50 top_k=5

运行基准测试并记录结果

rag-evaluator benchmark latency=230ms recall@5=0.82 precision@5=0.71

比较两种检索策略

rag-evaluator compare bm25 vs dense: bm25 recall=0.78, dense recall=0.85

跟踪评估分数

rag-evaluator evaluate faithfulness=0.91 relevance=0.87 coherence=0.93

记录某次运行的API成本

rag-evaluator cost run-042: $0.23 (1.2k tokens input, 800 tokens output)

查看汇总统计信息

rag-evaluator stats

将所有数据导出为CSV

rag-evaluator export csv

搜索特定条目

rag-evaluator search gpt-4

检查最近活动

rag-evaluator recent

健康检查

rag-evaluator status

输出

所有命令输出到标准输出。如需重定向到文件:

bash
rag-evaluator report weekly summary > report.txt
rag-evaluator export json # 保存到 ~/.local/share/rag-evaluator/export.json

配置

通过修改脚本设置 DATA_DIR,或使用默认值:~/.local/share/rag-evaluator/



由BytesAgain提供技术支持 | bytesagain.com | hello@bytesagain.com

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 rag-evaluator-1776100860 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 rag-evaluator-1776100860 技能

通过命令行安装

skillhub install rag-evaluator-1776100860

下载

⬇ 下载 Ragaai Catalyst v2.0.0(免费)

文件大小: 4.6 KB | 发布时间: 2026-4-17 15:54

v2.0.0 最新 2026-4-17 15:54
publish v2.0.0

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部