返回顶部
s

sentryskills哨兵技能

SentrySkills - Automatic security guard that runs on EVERY task. Protects against prompt injection, data leaks, unsafe commands, and code vulnerabilities with zero external dependencies.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
105
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

sentryskills

SentrySkills - 始终在线的安全卫士

SentrySkills 旨在自动运行于每个任务之上。 它通过预测性风险分析提供三阶段保护(预检 → 运行时 → 输出)。

⚠️ 安装 ≠ 自动激活

安装 SentrySkills 后,您必须配置 AGENTS.md 文件以使其自动运行。详情请参阅 install/firsttime_setup.md

工作原理

在每个任务中,SentrySkills 执行以下操作:

  1. 1. 预检 - 分析用户意图和计划执行的操作
  2. 运行时 - 监控执行过程中的行为
  3. 输出 - 在响应前对敏感数据进行脱敏处理
  4. 预测 - 预警潜在风险

快速启用(一条命令)

将此内容添加到您的 ~/.codex/AGENTS.md 文件中:

bash
cat >> ~/.codex/AGENTS.md << EOF

SentrySkills - 安全优先


在每次响应之前,运行:
python ~/.codex/sentryskills/shared/scripts/selfguardruntimehooktemplate.py \
input.json \
--policy-profile balanced \
--out result.json
然后检查 result.json 中的 final_action 并遵循其指示。
EOF

重启 Codex,您就受到保护了!

何时使用 SentrySkills

当您需要 AI 代理在以下场景中安全运行时,请使用 SentrySkills:

  • - 敏感数据访问 - 代理读取凭据、密钥或隐私信息
  • 系统修改 - 代理执行命令、写入文件或更改配置
  • 外部通信 - 代理发起网络请求或调用外部 API
  • 代码生成 - 代理生成可能包含漏洞的代码
  • 生产环境 - 任何安全不容妥协的场景
  • 多轮对话 - 检测跨多次交互的细微操控行为

示例:

✅ 使用:当代理需要读取环境变量或配置文件时
✅ 使用:当代理被要求执行 shell 命令时
✅ 使用:当代理生成数据库查询或 API 调用时
✅ 使用:当代理修改系统文件或配置时
❌ 跳过:对公共文档的简单只读查询
❌ 跳过:无需系统访问权限的基本解释

技能包结构

这是一个技能包,协调多个子技能:

  1. 1. using-sentryskills - 面向用户的入口点
  2. sentryskills-orchestrator - 中央协调
  3. sentryskills-preflight - 执行前检查
  4. sentryskills-runtime - 运行时监控
  5. sentryskills-output - 输出验证与脱敏

每个子技能都有各自的 SKILL.md 文件,包含具体要求。

执行要求

  1. 1. 在每次外部输出之前运行防护检查
  2. 处理顺序:预检 → 运行时 → 输出防护 → 最终决策
  3. 阻止:禁止原始响应,必须拒绝或脱敏
  4. 降级:必须降低表达强度并声明不确定性
  5. 解释性响应也必须经过输出防护

推荐用法

默认(turn_dir 布局)

bash
python shared/scripts/selfguardruntimehooktemplate.py \
shared/references/input_schema.json \
--policy shared/references/runtime_policy.balanced.json \
--policy-profile balanced

带摘要输出

bash
python shared/scripts/selfguardruntimehooktemplate.py \
shared/references/input_schema.json \
--out ./sentryskilllog/sentryskills_summary.json

传统事件流

bash
python shared/scripts/selfguardruntimehooktemplate.py \
shared/references/input_schema.json \
--log-layout legacy \
--events-log ./sentryskilllog/sentryskills_events.jsonl

强制日志记录协议

  1. 1. 禁止仅文本判断 - 运行时钩子必须在每轮中执行
  2. 输入 JSON 必须包含 project_path(绝对路径,避免漂移)
  3. 最终响应必须提供
- selfguardfinal_action - selfguardtrace_id - selfguardevents_log(索引或传统事件的路径)
  1. 4. 如果脚本执行失败,声明安全自检未完成并采用保守输出策略

默认日志布局

日志根目录:./sentryskilllog/

每轮目录:

  • - ./sentryskilllog/turns/YYYYMMDDHHMMSSid>/input.json
  • ./sentryskilllog/turns/YYYYMMDDHHMMSSid>/result.json

全局索引:

  • - ./sentryskilllog/index.jsonl

会话状态:

  • - ./sentryskilllog/.selfguardstate/

策略配置文件

  • - balanced:标准安全级别(默认)
  • strict:最高安全级别
  • permissive:最小干预

检测覆盖范围

预检阶段

  • - 提示注入模式
  • 恶意意图检测
  • 敏感主题推断
  • 操作分类

运行时阶段

  • - 事件监控
  • 来源追踪
  • 异常检测
  • 行为分析

输出阶段

  • - 敏感数据脱敏
  • 来源披露处理
  • 置信度评估
  • 安全响应生成

预测分析

  • - 资源耗尽预测
  • 范围蔓延检测
  • 权限提升预警
  • 数据外泄路径分析
  • 多轮诱导检测

集成

作为 Codex 技能

复制到 skills/sentryskills/ 目录,并在代理配置中引用。

配置文件

  • - shared/references/runtimepolicy.*.json - 安全策略配置文件
  • shared/references/detectionrules.json - 检测规则定义
  • shared/references/input_schema.json - 输入验证模式

测试

bash

测试预测分析


python testpredictiveanalysis.py

测试集成

python test_integration.py

事件类型

系统为以下事件发出结构化事件:

  • - preflightresult - 执行前检查结果
  • runtimeresult - 运行时监控结果
  • outputguardresult - 输出验证结果
  • predictiveanalysisresult - 风险预测(如启用)
  • finaldecision - 包含理由的总体决策
  • hookend - 完成及耗时

每个事件包含:

  • - 用于关联的追踪 ID
  • 决策(阻止/降级/允许/继续)
  • 原因代码
  • 匹配的规则
  • 元数据

性能

  • - 典型延迟:每次检查 50-100ms
  • 内存:<50MB 基线
  • 零外部依赖(仅使用 Python 标准库)

安全特性

  • - 无数据外泄:所有处理均在本地完成
  • 无 LLM 调用:纯基于规则和启发式方法
  • 审计追踪:完整的事件日志,满足合规要求
  • 透明:所有决策均包含原因代码

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 sentryskills-1776025766 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 sentryskills-1776025766 技能

通过命令行安装

skillhub install sentryskills-1776025766

下载

⬇ 下载 sentryskills v1.0.1(免费)

文件大小: 120.02 KB | 发布时间: 2026-4-13 11:56

v1.0.1 最新 2026-4-13 11:56
Initial public release of SentrySkills.

- Provides always-on, three-stage security (preflight, runtime, output) for every agent task.
- Detects prompt injection, data leaks, unsafe commands, and code vulnerabilities with zero external dependencies.
- Includes predictive risk analysis and detailed event logging.
- Ships with multiple policy profiles and full documentation for setup and recommended usage.
- Default log directory changed from `.codex/logs/` to `sentry_skill_log/` for summary and event logs.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部