Use this skill when the user wants to monitor LLM behavior over time and get alerted when outputs change unexpectedly. Triggers on requests like "set up LLM regression monitoring", "alert me when my prompts start behaving differently", "watch my LLM for regressions", "run behavioral tests on my AI outputs on a schedule", or "detect when my model starts drifting". Handles first-time setup, baseline capture, scheduled monitoring, and alert configuration.
针对LLM应用的自动化行为回归监控。捕获基线输出,按计划检测漂移,并在出现回归时立即通过WhatsApp或Slack发送警报。
用户请求
├── 设置监控 / 首次使用 → 完整设置(步骤1-5)
├── 立即运行监控 → 仅步骤4
├── 我修改了提示词/模型 → 步骤3b(更新基线)
└── 配置警报 → 步骤5
bash
pip install llm-behave[semantic] pyyaml requests
在项目根目录创建。最小示例:
yaml
tests:
- name: support_response
prompt: 客户说他们没有收到订单。你如何回应?
provider: openai # openai | anthropic | ollama | custom
model: gpt-4o-mini
assertions:
- type: tone
expected: 富有同理心
drift:
enabled: true
threshold: 0.80
为所选提供商设置API密钥:
bash
export OPENAIAPIKEY=sk-...
export ANTHROPICAPIKEY=sk-ant-... # 如果使用anthropic
阅读 references/test-suite-format.md 获取完整字段说明。
阅读 references/providers.md 获取环境变量和Ollama设置。
bash
python scripts/capture_baseline.py
将基准输出保存到 .llmbehavebaselines/。在开始监控前运行一次。
bash
bash
python scripts/run_monitor.py
写入 monitor_report.json。全部通过时退出码为0,任何失败时退出码为1(兼容CI)。
bash
添加到项目根目录的 .env 文件 — 脚本会自动加载。通过以下命令发送:
bash
python scripts/send_alert.py
运行正常时保持静默。所有警报均记录到 monitor_alerts.log。
与用户确认调度计划(默认:每天上午9点),然后添加:
|| sendalert.py 仅在 runmonitor.py 退出码为1(发现失败)时触发。
| 错误 | 修复方法 |
|---|---|
| llm-behave is not installed | pip install llm-behave[semantic] |
| OPENAIAPIKEY is not set |
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 llm-regression-monitor-1775978882 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 llm-regression-monitor-1775978882 技能
skillhub install llm-regression-monitor-1775978882
文件大小: 14.19 KB | 发布时间: 2026-4-13 10:53