扫码关注官方微信

扫码下载APP

返回顶部

m

ml-model-eval-benchmark模型评估基准

Compare model candidates using weighted metrics and deterministic ranking outputs. Use for benchmark leaderboards and model promotion decisions.

作者: admin | 来源: ClawHub

下载

源自

ClawHub

版本

V 0.1.0

安全检测

已通过

393
下载量

免费
免费

0
收藏

概述

安装方式

版本历史

ml-model-eval-benchmark

ML模型评估基准

概述

根据指标加权评估输入，生成一致的模型排名输出。

工作流程

1. 定义指标权重和可接受的指标范围。
为每个候选模型导入模型指标。
计算加权得分和排名。
导出排行榜和晋升推荐。

使用捆绑资源

- 运行 scripts/benchmark_models.py 生成基准测试输出。
阅读 references/benchmarking-guide.md 获取权重设置和打破平局的指导。

约束条件

- 确保各候选模型的指标名称和尺度保持一致。
在输出中记录权重假设。

通过对话安装

该技能支持在以下平台通过对话安装：

OpenClaw WorkBuddy QClaw Kimi Claude

方式一：安装 SkillHub 和技能

帮我安装 SkillHub 和 ml-model-eval-benchmark-1776296784 技能

方式二：设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源，然后帮我安装 ml-model-eval-benchmark-1776296784 技能

通过命令行安装

skillhub install ml-model-eval-benchmark-1776296784

下载

⬇ 下载 ml-model-eval-benchmark v0.1.0（免费）

文件大小: 3.52 KB | 发布时间: 2026-4-16 17:58

v0.1.0 最新 2026-4-16 17:58

- Initial release of ml-model-eval-benchmark.
- Supports weighted metric evaluation and deterministic model ranking.
- Enables benchmark leaderboard generation and model promotion decisions.
- Includes scripts and guides for consistent evaluation workflows.
- Enforces standardized metric names, scales, and explicit weighting documentation.

闲社论坛
定制服务闲社视频会员介绍开通会员
闲社论坛
智能体论坛技能自动化 AI服务市场大模型社区
网站服务
会员咨询：515151560 广告合作：515151570 投诉建议：515151580 售后指导：515151590

多链集团旗下-闲社网

闲社网热线

免费联系电话

0527-80111111

服务时间：周一到周日 8:00-24:00

公众号
闲社 APP下载闲社

关注闲社网

闲社在线客服
关注闲社网微信
闲社网APP

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

返回顶部

ml-model-eval-benchmark模型评估基准

ml-model-eval-benchmark

ML Model Eval Benchmark

Overview

Workflow

Use Bundled Resources

Guardrails

ML模型评估基准

概述

工作流程

使用捆绑资源

约束条件

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

ml-model-eval-benchmark模型评估基准

ml-model-eval-benchmark

ML Model Eval Benchmark

Overview

Workflow

Use Bundled Resources

Guardrails

ML模型评估基准

概述

工作流程

使用捆绑资源

约束条件

标签

通过对话安装

方式一：安装 SkillHub 和技能

方式二：设置 SkillHub 为优先技能安装源

通过命令行安装

下载

相关推荐

self-improvement

self-improvement

self-improvement

self-improvement