大模型安全测评全流程管理技能使用指南
触发条件
当用户发送包含"创建资产"、"更新资产"、"发起测评"、"分析测评"、"查询资源"等关键词的指令时,触发本技能。
脚本位置说明
脚本目录: INLINECODE0
执行方式:
CODEBLOCK0
以下示例均需先进入脚本目录
⚠️ 易错点说明
1. 资产ID vs 资产名称
- -
update_asset_model.ts 的第一个参数是 Name(资产名称),不是 AssetID。脚本会自动根据名称和ModelID查询资产ID。 update_asset_agent.ts 的参数是 <AgentID> <Name> <PlatformID>,需要同时提供资产ID和名称。
2. 脚本代码问题
- - 部分脚本可能存在重复属性问题(如
proxy: false 重复),导致 TypeScript 编译错误。如遇此类错误,需要检查并修复脚本代码。
3. 模态类型匹配
- - 资产的模态类型必须包含测评集的模态类型,否则无法发起测评。
- 例如:测评集是
text2text,资产的模态类型可以是 text2text 或 text2text,image2text,但不能只有 image2text。
4. 智能体平台参数
- - 不同智能体平台需要不同的参数,必须先用
list_agent_platforms.ts vars <PlatformID> 查询该平台需要的参数。
5. 安全测评剧本适用范围
- - 部分安全测评剧本专门针对 OpenClaw,部分是通用的。查询剧本时会显示
assetTypes[] 字段,如果为空则表示通用。
通用枚举
模态类型
- -
text2text:文生文 - INLINECODE14 :图文生文
- INLINECODE15 :文生图
资产类型
- -
model:大模型 - INLINECODE17 :智能体
- INLINECODE18 :OpenClaw 资产
合规测评任务状态
| 状态码 | 状态名称 | 说明 |
|---|
| 0 | 待测评 | 任务已创建,等待开始执行 |
| 1 |
测评中 | 任务正在执行 |
| 2 | 测评成功 | 任务执行完成(终态) |
| 3 | 测评异常 | 任务执行失败(终态) |
| 5 | 暂停测评 | 任务被暂停(终态) |
| 6 | 终止测评 | 任务被终止(终态) |
安全测评任务状态
| 状态码 | 状态名称 | 说明 |
|---|
| 10 | 等待处理 | 任务已创建,等待开始执行 |
| 20 |
处理中 | 任务正在执行 |
| 30 | 异常 | 任务执行失败(终态) |
| 40 | 完成 | 任务执行完成(终态) |
资产管理
1. 创建大模型资产
调用:
CODEBLOCK1
参数:
- -
Name:资产名称(如:deepseek-v3) - INLINECODE20 :模型 ID(如:ep-20250325142301-ljxvm)
- INLINECODE21 :API 地址(如:https://ark-cn-beijing.bytedance.net/api/v3)
- INLINECODE22 :API 密钥(如:sk-xxxxxxxxxxxx)
- INLINECODE23 :模态类型(可选,逗号分隔,默认:text2text)
示例:
npx ts-node src/create_asset_model.ts deepseek-v3 ep-20250325142301-ljxvm https://ark-cn-beijing.bytedance.net/api/v3 sk-xxxxxxxxxxxx text2text
2. 更新大模型资产
调用:
CODEBLOCK3
参数:
- -
Name:资产名称(⚠️ 注意:不是 AssetID,脚本会自动查询) - INLINECODE25 :模型 ID
- INLINECODE26 :API 地址
- INLINECODE27 :API 密钥
- INLINECODE28 :模态类型(可选,逗号分隔,默认:text2text)
示例:
CODEBLOCK4
⚠️ 注意:
- - 第一个参数是
Name(资产名称),不是 INLINECODE30 - 脚本会根据
Name 和 ModelID 自动查询资产ID
3. 查询智能体平台
调用:
CODEBLOCK5
⚠️ 注意:
- - 创建智能体资产前,必须先查询该平台需要的参数
- 不同平台需要的参数不同,例如 dify 平台需要
api_key,hiagent 平台可能需要其他参数
4. 创建智能体资产
调用:
CODEBLOCK6
参数:
- -
Name:智能体资产名称 - INLINECODE35 :平台 ID(通过
list_agent_platforms.ts list 查询) - INLINECODE37 :智能体对话变量(可多个,支持 JSON 格式)
示例:
CODEBLOCK7
⚠️ 注意:
- - 必须先用
list_agent_platforms.ts vars <PlatformID> 查询该平台需要的参数 - 参数格式为
--key=value,例如 --api_key=app-xxx、 INLINECODE41
5. 更新智能体资产
调用:
CODEBLOCK8
参数:
- -
AgentID:资产 ID - INLINECODE43 :智能体资产名称
- INLINECODE44 :平台 ID
- INLINECODE45 :智能体对话变量(可多个,支持 JSON 格式)
示例:
CODEBLOCK9
⚠️ 注意:
- - 参数顺序是
<AgentID> <Name> <PlatformID>,与创建智能体不同 - 需要同时提供资产ID和名称
资源查询
6. 查询可用资源
调用:
CODEBLOCK10
参数:
- -
ModalTypes:模态类型(可选,逗号分隔,如:text2text,image2text) - INLINECODE48 :资产类型(可选,用于筛选剧本)
输出示例:
CODEBLOCK11
⚠️ 注意:
- - 查询资源时会显示资产的模态类型,确保资产的模态类型包含测评集的模态类型
- 例如:测评集是
text2text,资产的模态类型可以是 text2text 或 INLINECODE51
合规测评
7. 发起合规测评任务
调用:
CODEBLOCK12
参数:
- -
测评集ID:测评集的唯一标识符 - INLINECODE53 :测评对象的唯一标识符(模型、智能体或 OpenClaw)
- INLINECODE54 :资产类型(可选,默认:model)
⚠️ 注意:
- - 资产的模态类型必须包含测评集的模态类型,否则无法发起测评
- 如果资产模态类型不匹配,会返回错误
8. 分析合规测评任务
调用::
CODEBLOCK13
参数:
- -
TaskID:任务 ID(格式如:019ce0495b68758ea00fda8fc63b2ba0)
功能:
- - 查询任务状态
- 如果任务成功完成,自动拉取数据并分析
- 如果任务未完成,显示执行进度和预估时间
- 如果任务异常/暂停/终止,显示状态并提示无法分析
输出(任务已完成):
CODEBLOCK14
输出(任务未完成):
任务状态:测评中(状态码:1)
执行进度:30/76 (39.5%)
预计剩余时间:1分钟
安全测评
9. 发起安全测评任务
调用:
CODEBLOCK16
参数:
- -
TaskName:任务名称(如:提示词注入测试) - INLINECODE57 :测评对象 ID(模型、智能体或 OpenClaw)
- INLINECODE58 :资产类型(model/agent/openclaw)
- INLINECODE59 :安全测评剧本 ID(通过
list_rt_scenarios.ts 查询)
⚠️ 注意:
- - 部分剧本专门针对 OpenClaw,部分是通用的
- 查询剧本时会显示
assetTypes[] 字段,如果为空则表示通用 - 如果是 OpenClaw 专用剧本,资产类型必须是 INLINECODE62
10. 分析安全测评任务
调用:
CODEBLOCK17
参数:
功能:
输出:
CODEBLOCK18
⚠️ 注意:
- - 如果任务状态是
20(处理中),需要等待任务完成后再分析 - 可以多次运行此命令查询任务进度
大模型安全测评全流程管理技能使用指南
触发条件
当用户发送包含创建资产、更新资产、发起测评、分析测评、查询资源等关键词的指令时,触发本技能。
脚本位置说明
脚本目录: ~/.openclaw/workspace/skills/byted-security-llmscanner/scripts/
执行方式:
bash
cd ~/.openclaw/workspace/skills/byted-security-llmscanner/scripts
npx ts-node src/createassetmodel.ts <参数...>
以下示例均需先进入脚本目录
⚠️ 易错点说明
1. 资产ID vs 资产名称
- - updateassetmodel.ts 的第一个参数是 Name(资产名称),不是 AssetID。脚本会自动根据名称和ModelID查询资产ID。
- updateassetagent.ts 的参数是 ,需要同时提供资产ID和名称。
2. 脚本代码问题
- - 部分脚本可能存在重复属性问题(如 proxy: false 重复),导致 TypeScript 编译错误。如遇此类错误,需要检查并修复脚本代码。
3. 模态类型匹配
- - 资产的模态类型必须包含测评集的模态类型,否则无法发起测评。
- 例如:测评集是 text2text,资产的模态类型可以是 text2text 或 text2text,image2text,但不能只有 image2text。
4. 智能体平台参数
- - 不同智能体平台需要不同的参数,必须先用 listagentplatforms.ts vars 查询该平台需要的参数。
5. 安全测评剧本适用范围
- - 部分安全测评剧本专门针对 OpenClaw,部分是通用的。查询剧本时会显示 assetTypes[] 字段,如果为空则表示通用。
通用枚举
模态类型
- - text2text:文生文
- image2text:图文生文
- text2image:文生图
资产类型
- - model:大模型
- agent:智能体
- openclaw:OpenClaw 资产
合规测评任务状态
| 状态码 | 状态名称 | 说明 |
|---|
| 0 | 待测评 | 任务已创建,等待开始执行 |
| 1 |
测评中 | 任务正在执行 |
| 2 | 测评成功 | 任务执行完成(终态) |
| 3 | 测评异常 | 任务执行失败(终态) |
| 5 | 暂停测评 | 任务被暂停(终态) |
| 6 | 终止测评 | 任务被终止(终态) |
安全测评任务状态
| 状态码 | 状态名称 | 说明 |
|---|
| 10 | 等待处理 | 任务已创建,等待开始执行 |
| 20 |
处理中 | 任务正在执行 |
| 30 | 异常 | 任务执行失败(终态) |
| 40 | 完成 | 任务执行完成(终态) |
资产管理
1. 创建大模型资产
调用:
bash
npx ts-node src/createassetmodel.ts [ModalTypes]
参数:
- - Name:资产名称(如:deepseek-v3)
- ModelID:模型 ID(如:ep-20250325142301-ljxvm)
- BaseUrl:API 地址(如:https://ark-cn-beijing.bytedance.net/api/v3)
- ApiKey:API 密钥(如:sk-xxxxxxxxxxxx)
- ModalTypes:模态类型(可选,逗号分隔,默认:text2text)
示例:
bash
npx ts-node src/createassetmodel.ts deepseek-v3 ep-20250325142301-ljxvm https://ark-cn-beijing.bytedance.net/api/v3 sk-xxxxxxxxxxxx text2text
2. 更新大模型资产
调用:
bash
npx ts-node src/updateassetasset_model.ts [ModalTypes]
参数:
- - Name:资产名称(⚠️ 注意:不是 AssetID,脚本会自动查询)
- ModelID:模型 ID
- BaseUrl:API 地址
- ApiKey:API 密钥
- ModalTypes:模态类型(可选,逗号分隔,默认:text2text)
示例:
bash
npx ts-node src/updateassetmodel.ts deepseek-v3 ep-new-model-id https://ark-cn-beijing.bytedance.net/api/v3 sk-new-api-key text2text
⚠️ 注意:
- - 第一个参数是 Name(资产名称),不是 AssetID
- 脚本会根据 Name 和 ModelID 自动查询资产ID
3. 查询智能体平台
调用:
bash
查询所有平台
npx ts-node src/list
agentplatforms.ts list
查询平台需要的变量
npx ts-node src/list
agentplatforms.ts vars
⚠️ 注意:
- - 创建智能体资产前,必须先查询该平台需要的参数
- 不同平台需要的参数不同,例如 dify 平台需要 api_key,hiagent 平台可能需要其他参数
4. 创建智能体资产
调用:
bash
npx ts-node src/createassetagent.ts [options]
参数:
- - Name:智能体资产名称
- PlatformID:平台 ID(通过 listagentplatforms.ts list 查询)
- --key=value:智能体对话变量(可多个,支持 JSON 格式)
示例:
bash
npx ts-node src/createassetagent.ts 客服助手 b0226c4550aa4791a8c19a118a5f8ef5 --api_key=app-xxxxxxxxxxxx
⚠️ 注意:
- - 必须先用 listagentplatforms.ts vars 查询该平台需要的参数
- 参数格式为 --key=value,例如 --apikey=app-xxx、--userid=admin
5. 更新智能体资产
调用:
bash
npx ts-node src/updateassetagent.ts [options]
参数:
- - AgentID:资产 ID
- Name:智能体资产名称
- PlatformID:平台 ID
- --key=value:智能体对话变量(可多个,支持 JSON 格式)
示例:
bash
npx ts-node src/updateassetagent.ts asset9876543210 客服助手 b0226c4550aa4791a8c19a118a5f8ef5 --apikey=app-zzzzzzzzzzzz
⚠️ 注意:
- - 参数顺序是 ,与创建智能体不同
- 需要同时提供资产ID和名称
资源查询
6. 查询可用资源
调用:
bash
查询合规测评资源(测评集、资产)
npx ts-node src/list_resources.ts [ModalTypes]
查询安全测评资源(资产、剧本)
npx ts-node src/fetch_lists.ts [ModalTypes]
查询安全测评剧本
npx ts-node src/listrtscenarios.ts [AssetType]
参数:
- - ModalTypes:模态类型(可选,逗号分隔,如:text2text,image2text)
- AssetType:资产类型(可选,用于筛选剧本)
输出示例:
=== 可用测评集 ===
ID: suite_001, 名称: 安全合规测评集, 模态: 文生文
=== 可用大模型资产 ===
ID: asset_001, 名称: deepseek-v3, 模态: 文生文
=== 可用智能体资产 ===
ID: asset_003, 名称: 客服助手, 模态: 文生文
⚠️ 注意:
- - 查询资源时会显示资产的模态类型,确保资产的模态类型包含测评集的模态类型
- 例如:测评集是 text2text,资产的模态类型可以是 text2text 或 text2text,image2text
合规测评
7. 发起合规测评任务
调用: