返回顶部
b

byted-emr-skillsEMR集群管理

byted-emr-skills提供管理火山引擎EMR(火山引擎 E-MapReduce(简称“EMR”)是开源Hadoop生态的企业级大数据分析系统,完全兼容开源)的技能,包括管理EMR on ECS集群、EMR on VKE集群、EMR serverless队列、计算组、作业模板/实例、日志、监控并提供 EMR Agent 智能诊断与知识问答能力。当用户提及“EMR on ECS集群”、“EMR on VKE集群”、“Serverless 队列”、“Serverless 作业”、“SparkSQL/PrestoSQL/Ray/PySpark/SparkJar 作业”、“作业日志”、“作业监控”、“作业诊断”等需求时,应优先使用此技能。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
90
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

byted-emr-skills

EMR 技能

  • - 何时使用(触发短语)
  • 当用户提出以下任何类似需求时,立即调用该技能:

“查询EMR集群的服务列表”
“重启Spark服务”
“获取 EMR 作业日志”
“查看EMR serverless队列列表”
“查看EMR serverless队列详情”
“使用 EMR Serverless 运行任务”
“在 EMR 上提交一个 Spark 作业”
“帮我诊断一下失败的 Spark 作业”
“分析一下EMR作业失败的原因”

  • - 任何涉及 EMR Serverless 作业/队列/计算组/监控/日志/诊断 的操作询问

功能清单

  • - EMR Serverless
- 队列:开通公共队列、队列列表查询、队列详情查询、队列下计算组列表查询 - 队列权限:查询队列授权主体、为用户授予/修改队列权限 - 计算组:创建/修改/启动/停止/删除、查询可选规格与镜像、外部元数据连通性测试 - 作业模板:创建/更新/查询详情/列表查询/运行 - 作业实例:提交(SparkSQL/PrestoSQL/SparkJar/PySpark/RayJob)、查询状态与详情、取消、获取 tracking url、获取提交日志与执行日志、列表查询、重跑、结果分批拉取 - 监控:队列/计算组/作业监控数据查询,按指标清单逐项拉取并汇总报告
  • - EMR Agent
- 交互式诊断与知识问答 - 会话与报告管理
  • - EMR on ECS
- 集群:查看集群详情、集群列表、更新集群属性 - 节点组:列出节点组、更新节点组属性、节点列表、扩容节点组磁盘、更新节点组ECS规格 - 服务:列出应用、组件列表、组件实例列表、执行应用操作 - 服务配置:配置文件列表、配置文件详情、配置项列表、配置项修改历史列表、修改配置项 - 操作审计:操作列表查询 - 用户:创建集群用户、修改已创建用户信息、获取集群用户列表、获取用户详情、更新集群用户密码 - 用户组:获取集群用户组列表、集群用户组详情、创建集群用户组、更新集群用户组
  • - EMR on VKE
- 集群:查看集群列表、集群详情 - 服务(应用):查看服务列表、服务组件实例、重启服务或组件实例、查看服务配置参数、修改服务配置参数 - 操作日志:查看操作日志列表、操作日志详情

初始设置

  • - 确保已配置火山引擎 API 凭证:
bash export VOLCENGINE_AK=your-access-key export VOLCENGINE_SK=your-secret-key export VOLCENGINE_REGION=cn-beijing
  • - 安装emr serverless sdk,调用scripts/bin/installserverlesssdk.sh安装

如何管理 EMR

1. EMR on Serverless管理

  • - 针对全托管的 Serverless 形态,主要面向作业提交和资源队列管理。
  • OpenAPI 推荐使用命令行工具:python ./scripts/onserverless/emrserverless_cli.py --action --method --query --body
- Region 默认从环境变量 VOLCENGINE_REGION 读取(默认 cn-beijing) - Service/Version 会根据 Action 自动推断(需要时也可显式传 --service/--version) - 自定义 endpoint(如 LAS)可额外传 --endpoint las.cn-beijing.volcengineapi.com
  • - 作业提交推荐使用命令行工具:python ./scripts/onserverless/emrserverlesssubmitcli.py ...

如何管理资源队列

  • - 支持的功能列表
- 队列列表:查看所有资源队列及其配置(如最大资源、当前使用量), 必须使用OpenAPIListTagQueue查询队列列表。 - 队列详情:获取队列的详细信息,包括绑定的网络、存储等, 必须使用OpenAPIGetQueue查询队列详情。 - 队列监控:通过云监控接口获取队列近一天的资源使用率、作业数、失败作业数量等(需要云监控权限)。 - 创建队列:一键创建公共队列, 必须使用OpenAPICreateQueueSilently或CreateOrderInOneStep创建队列。 - 队列计算组列表:获取指定队列下的计算组(Queue Component)列表与详情,必须使用OpenAPIListQueueComponent查询队列计算组列表。
  • - 所有的队列功能操作详情,请严格按照references/emrserverless/queue/emrserverlessqueueguide.md中的说明进行操作。

如何管理队列权限

  • - 支持的功能列表
- 获取队列权限列表:根据指定的队列,获取具有其权限的用户/用户组列表, 必须使用OpenAPIListAuthorizedPrincipalsForQueue查询队列权限列表。 - 模糊搜索队列权限:根据用户名模糊查询用户列表,同时判断用户是否已经具有指定队列的权限,必须使用OpenAPIListIAMUsersWithQueueRole查询队列权限列表。 - 添加用户权限:为用户授予指定数据对象的权限,必须使用OpenAPIGrantQueuePrivilege添加用户权限。 - 修改用户的队列权限:修改用户对指定队列的权限, 必须使用OpenAPIAlterQueuePrivilege修改用户权限。
  • - 所有的功能操作详情,请严格按照references/emrserverless/privilege/emrserverlessprivilegeguide.md中的说明进行操作。

如何管理作业模板

  • - 必须注意作业模板和作业实例的区别:
- 作业模板:定义作业的通用配置,包括代码路径、参数、环境变量等。 - 作业实例:基于作业模板创建的具体运行实例,包含作业 ID、运行参数、状态等。
  • - 支持的作业模板功能列表
- 创建作业模板:定义作业模板(包含代码路径、参数、环境配置等),必须使用OpenAPICreateJobDefinition创建作业模板。 - 执行或运行作业模板:基于已有作业模板触发一次运行,必须使用OpenAPIRunJobDefinition执行作业模板。 - 修改作业模板:修改作业模板(如执行资源、代码路径、入口命令等),但不影响已提交的作业实例,必须使用OpenAPIAlterJobDefinition修改作业模板。 - 查询作业模板详情:获取作业模板的详细配置信息,必须使用OpenAPIGetJobDefinition查询作业模板详情。 - 查询作业模板列表:获取所有已创建的作业模板列表,必须使用OpenAPIListJobDefinitions查询作业模板列表。
  • - 所有作业模板(即作业定义)的详细操作指南,请严格按照references/emrserverless/job/emrserverlessjobguide.md中的说明进行操作。

如何管理作业实例

  • - 作业实例功能列表
- 提交作业:支持 SparkSQL、PrestoSQL、SparkJar、PySpark、RayJob 等类型;SparkJar/PySpark/RayJob 支持作业执行脚本使用本地路径(由 SDK 自动上传至 TOS,细节见作业实例指南)。 - 查询作业实例:推荐使用 OpenAPI QueryGetJobV2 获取状态与详情。 - 终止作业实例:OpenAPI QueryCancelQueryV2。 - 获取作业日志:OpenAPI FetchDriverLog / QueryFetchSubmitLog(支持关键字过滤)。 - 分批获取结果数据:对于 SQL 类作业,可通过OpenAPI QueryFetchResultsByBatch 分批获取结果 - 获取 Tracking url:OpenAPI QueryGetTrackingURL。 - 作业实例列表:OpenAPI ListJobInstances。
  • - 所有作业实例的详细操作指南,请严格按照references/emrserverless/jobinstance/emrserverlessjobinstanceguide.md中的说明进行操作。

如何管理计算组(Serverless 资源单元)

  • - 创建/修改计算组配置。
  • 查询计算组监控数据,支持监控总结和巡检。

如何查询操作日志

  • - 功能列表
- 全局操作日志页面以及队列、计算组的操作列表查询
  • - 所有的操作日志查询,请严格按照references/emrserverless/operationaudit/emrserverlessoperationauditguide.md中的说明进行操作。

如何查询队列、计算组、作业监控数据

  • - 功能列表
- 队列计算组作业监控数据查询:获取队列、计算组、作业的监控数据,包括 CPU 利用率、内存利用率、作业数、失败作业数量等,必须使用OpenAPIGetMetricData查询队列、计算组、作业监控数据。
  • - 所有的队列计算组作业监控数据查询操作,请严格按照references/emrserverless/monitor/emrserverless

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 byted-emr-skills-1775979543 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 byted-emr-skills-1775979543 技能

通过命令行安装

skillhub install byted-emr-skills-1775979543

下载

⬇ 下载 byted-emr-skills v1.0.2(免费)

文件大小: 84.76 KB | 发布时间: 2026-4-13 09:36

v1.0.2 最新 2026-4-13 09:36
byted-emr-skills v1.0.2 Changelog

- No file or functional changes in this version.
- Documentation (SKILL.md) has been updated to clarify and summarize feature lists for EMR on ECS, VKE, Serverless, and EMR Agent.
- Detailed feature breakdown for EMR on ECS(节点组管理/服务/服务配置/操作审计/用户/用户组)now appears as a concise summary.
- No impact on usage or APIs.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部