返回顶部
l

llm-evaluator大模型评估器

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
722
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

llm-evaluator

LLM 评估器 ⚖️

基于Langfuse的LLM即评判者评估系统。使用GPT-5-nano对AI输出进行评分。

适用场景

  • - 评估搜索结果或AI回复的质量
  • 对追踪记录进行相关性、准确性、幻觉检测评分
  • 批量评分近期未评分的追踪记录
  • 对智能体输出进行质量保证

使用方法

bash

使用示例用例进行测试


python3 {baseDir}/scripts/evaluator.py test

对特定Langfuse追踪记录进行评分

python3 {baseDir}/scripts/evaluator.py score

仅使用特定评估器进行评分

python3 {baseDir}/scripts/evaluator.py score --evaluators relevance

对近期未评分的追踪记录进行回填评分

python3 {baseDir}/scripts/evaluator.py backfill --limit 20

评估器

评估器衡量指标评分范围
相关性回复与查询的相关性0–1
准确性
事实正确性 | 0–1 | | 幻觉 | 虚构信息检测 | 0–1 | | 有用性 | 整体实用性 | 0–1 |

致谢

M. Abidi 构建 | agxntsix.ai
YouTube | GitHub
属于OpenClaw智能体的 AgxntSix技能套件 的一部分。

📅 需要为您的业务搭建OpenClaw? 预约免费咨询

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 llm-evaluator-pro-1776420065 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 llm-evaluator-pro-1776420065 技能

通过命令行安装

skillhub install llm-evaluator-pro-1776420065

下载

⬇ 下载 llm-evaluator v1.0.0(免费)

文件大小: 5.1 KB | 发布时间: 2026-4-17 18:57

v1.0.0 最新 2026-4-17 18:57
LLM-as-a-Judge evaluator via Langfuse

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部