返回顶部
m

meerkat-governance猫鼬治理

AI governance API with two endpoints. Shield scans untrusted content for prompt injection and threats. Verify checks AI output for hallucinations, numerical errors, and manipulation against source data. Returns structured results with trust scores and remediation guidance. Full audit trail.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.4
安全检测
已通过
566
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

meerkat-governance

Meerkat 治理

范围: 此技能提供两个可供智能体调用的 API 端点。它不会自动激活,不会在后台运行,也不会访问内容,除非由智能体显式调用。开发者控制发送给 Meerkat 的内容。

隐私与数据处理: https://meerkatplatform.com/privacy
Meerkat 在内存中处理内容,并在响应后将其丢弃。仅存储信任分数和元数据。不保留任何原始内容。不与第三方共享任何数据。所有处理均在加拿大境内完成。

安全性: 您的 API 密钥用于验证对 Meerkat API 的请求。如果密钥泄露,可通过控制面板轮换密钥。所有通信均采用 TLS 1.2+ 加密。Meerkat 端点托管在 Azure 容器应用上,并配有托管 SSL 证书。在发送数据前,请验证端点主机名 (api.meerkatplatform.com) 是否与 TLS 证书匹配。

入站防护

/v1/shield 端点扫描内容中的提示注入、越狱、数据窃取和社会工程学攻击。智能体可以在处理开发者指定为不可信的内容之前调用此端点。常见示例包括外部电子邮件、网页抓取内容和用户上传的文档。开发者可以选择配置其智能体在安装前对技能描述进行防护。

bash
curl -s -X POST https://api.meerkatplatform.com/v1/shield \
-H Authorization: Bearer $MEERKATAPIKEY \
-H Content-Type: application/json \
-d {\input\: \\}

响应字段:

  • - safe (布尔值):内容是否通过扫描
  • threatlevel:NONE、LOW、MEDIUM、HIGH 或 CRITICAL
  • attacktype:检测到的威胁类别(如有)
  • detail:人类可读的描述
  • sanitizedinput:已移除威胁的内容(可用时)
  • auditid:审计记录的唯一标识符

智能体可以使用响应来决定如何处理。例如,标记为 HIGH 或 CRITICAL 的内容可以被阻止,而 MEDIUM 可以提示用户确认。如果返回了 sanitized_input,智能体可以使用清理后的版本。

出站验证

/v1/verify 端点使用多达五项机器学习检查来对照源数据检查 AI 生成的输出:蕴含关系 (DeBERTa NLI)、数值验证、语义熵、隐式偏好检测和声明提取。

bash
curl -s -X POST https://api.meerkatplatform.com/v1/verify \
-H Authorization: Bearer $MEERKATAPIKEY \
-H Content-Type: application/json \
-d {\input\: \REQUEST>\, \output\: \OUTPUT>\, \context\: \\, \domain\: \\}

domain 字段应用特定领域的规则。支持的值:healthcare、financial、legal、general。

响应字段:

  • - trustscore (0-100):所有检查的加权综合分数
  • status:PASS 或 FLAG(严重性通过 trustscore 和 remediation.severity 传达)
  • checks:每项检查的分数、标记和详细信息
  • remediation:修正和智能体指令(当状态不是 PASS 时)
  • auditid:审计记录的唯一标识符
  • sessionid:用于关联重试尝试的会话标识符

智能体可以使用状态和信任分数来决定是否继续。当存在 remediation 时,agentinstruction 字段包含自我修正的指导,corrections 列出具体错误(例如,发现值与期望值)。智能体可以应用修正后重新生成输出,并使用相同的 sessionid 重新提交以关联尝试。

观察模式

当未提供 context 字段时,Meerkat 以观察模式运行:它检查语义熵和隐式偏好,但跳过基于源的检查。响应中的 context_mode 字段将为 observation。这对于检查不存在源文档的开放式生成非常有用。

审计追踪

每次防护和验证调用都会记录一个审计 ID。/v1/audit/id> 端点检索完整记录。添加 ?includesession=true 以查看重试会话中所有关联的尝试。

bash
curl -s https://api.meerkatplatform.com/v1/audit/ \
-H Authorization: Bearer $MEERKATAPIKEY

设置

  1. 1. 在 https://meerkatplatform.com 获取免费 API 密钥(每月 10,000 次验证,无需信用卡)
  2. 设置环境变量:MEERKATAPIKEY=mkliveyourkeyhere
  3. 开发者通过其智能体配置控制发送给 Meerkat 的内容。智能体在处理不可信的外部内容前调用防护端点,在执行高影响操作前调用验证端点。

检测能力

请参阅 https://meerkatplatform.com/docs 了解示例载荷和响应格式。

入站检测:提示注入、间接注入、数据窃取尝试、越狱和角色劫持模式、凭证窃取以及社会工程学攻击。

出站检测:幻觉事实、数值失真(药物剂量、财务数据、法律条款)、虚构实体和引用、自信的胡言乱语、偏见和隐式偏好以及无依据的数字。

使用情况标头

每个 API 响应都包含使用情况标头:

  • - X-Meerkat-Usage:当前验证计数
  • X-Meerkat-Limit:月度限制(或unlimited)
  • X-Meerkat-Remaining:剩余验证次数
  • X-Meerkat-Warning:接近限制时的警告(80%+)

隐私

Meerkat 仅出于安全扫描目的处理内容。内容不会在审计追踪保留期限之外存储。您的 API 密钥限定于您的组织。详情请参阅 https://meerkatplatform.com/privacy。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 meerkat-governance-1776420080 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 meerkat-governance-1776420080 技能

通过命令行安装

skillhub install meerkat-governance-1776420080

下载

⬇ 下载 meerkat-governance v1.0.4(免费)

文件大小: 3.27 KB | 发布时间: 2026-4-17 19:27

v1.0.4 最新 2026-4-17 19:27
- Added _meta.json metadata file.
- Updated egress verify endpoint: status now limited to PASS or FLAG (BLOCK removed), with severity indicated by trust_score and remediation.severity.
- No other functionality or usage changes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部