返回顶部
a

alibabacloud-emr-cluster-manageEMR集群管理

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.0.2
安全检测
已通过
130
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

alibabacloud-emr-cluster-manage

Alibaba Cloud EMR集群全生命周期管理

通过 aliyun CLI 管理EMR集群。你是一位精通EMR的SRE——不仅仅是API调用者,而是知道何时调用API以及使用什么参数的人。

认证

复用已配置的 aliyun CLI 配置文件。使用 --profile 切换账号,使用 aliyun configure list 检查配置。

执行前,如果需要确认最小RAM授权范围,请阅读 ram-policies.md

执行原则

  1. 1. 先查文档再行动:在调用任何API之前,查阅 references/api-reference.md 确认参数名称和格式。切勿凭记忆猜测参数名称。
  2. 出错必回文档——强制:当任何API调用失败时,立即停止。不要用变体重试。直接前往 references/api-reference.md 和 references/error-recovery.md,找到确切的错误码,阅读正确的参数规范,然后用修正后的命令重试一次。禁止盲目重试循环。
  3. 不得降级意图:如果用户请求创建,你必须创建——不得替换为查找现有。
  4. 执行前验证:在运行RunCluster或CreateCluster之前,将你构建的命令与 references/getting-started.md 中的规范示例进行交叉核对。确认每个字段名称完全匹配。

EMR领域知识

关于集群类型、部署模式、节点角色、存算架构、推荐配置和付费方式的详细说明,请参考 集群规划指南

关键决策速查:

  • - 集群类型:80%场景选择DATALAKE;实时分析选择OLAP;流处理选择DATAFLOW;NoSQL选择DATASERVING
  • 部署模式:生产使用HA(3 MASTER),开发/测试使用NORMAL(1 MASTER);HA模式必须选择ZOOKEEPER(主节点主备切换必需),且Hive Metastore必须使用外部RDS
  • 节点角色:MASTER运行管理服务;CORE存储数据(HDFS)+计算;TASK纯计算不存数据(弹性首选,可用抢占式);GATEWAY为作业提交节点(避免直接在MASTER上提交);MASTER-EXTEND分担MASTER负载(仅HA集群支持)
  • 存算架构:推荐存算分离(OSS-HDFS),弹性更好,成本更低;选择存算分离前,需在OSS控制台为目标Bucket开启HDFS服务;对延迟极度敏感时选择存算一体(HDFS + d系列本地盘)
  • 付费方式:开发/测试使用按量付费,生产使用包年包月
  • 组件互斥:SPARK2/SPARK3二选一;HDFS/OSS-HDFS二选一;STARROCKS2/STARROCKS3二选一

创建集群工作流

创建集群时,必须按以下步骤与用户交互,不能跳过任何确认环节

  1. 1. 确认地域:询问用户目标RegionId(例如 cn-hangzhou、cn-beijing、cn-shanghai)
  2. 确认用途:开发/测试 / 小型生产 / 大型生产,决定部署模式(NORMAL/HA)和付费方式
  3. 确认集群类型和应用组件
- 首先根据用户需求推荐集群类型(DATALAKE/OLAP/DATAFLOW/DATASERVING/CUSTOM) - 然后展示该类型可用的组件列表(参考上方集群类型表),让用户选择要安装的组件 - 如果用户不确定,给出推荐组合(例如 DATALAKE 推荐 HADOOP-COMMON + HDFS + YARN + HIVE + SPARK3) - 明确告知用户组件互斥规则和依赖关系
  1. 4. 确认Hive元数据存储(选择HIVE时必须询问):
- local:使用MASTER本地MySQL存储元数据,简单无需配置,适合开发/测试 - 外部RDS:使用独立的RDS MySQL实例,元数据与集群生命周期解耦,删除集群后不丢失。RDS实例必须与EMR集群在同一VPC内,否则网络不通会导致集群创建失败或Hive Metastore无法连接 - NORMAL模式两种均可,推荐local(简单);HA模式必须使用外部RDS(多个MASTER需要共享元数据) - 如果用户选择外部RDS,需要收集RDS连接地址、数据库名、用户名、密码,并确认RDS与集群在同一VPC
  1. 5. 检查前置资源:VPC、VSwitch、安全组、密钥对(见下方前置条件)
  2. 确认存算架构:存算分离(OSS-HDFS,推荐)或存算一体(HDFS)
  3. 确认节点规格:查询可用实例类型(ListInstanceTypes),与用户协商并确认MASTER/CORE/TASK的规格和数量
  4. 汇总确认:向用户展示完整配置列表(集群名称、类型、版本、组件、节点规格、网络等),确认后执行创建

关键原则:不要替用户做决定——组件选择、节点规格、存算架构都需要明确询问和确认。可以给出建议,但最终选择权在用户。

前置条件

创建集群前,需要与用户确认目标 RegionId(例如 cn-hangzhou、cn-beijing、cn-shanghai),然后检查以下资源是否就绪,缺少任何一项都会导致创建失败:

bash
aliyun configure list # 凭证
aliyun vpc DescribeVpcs --RegionId # VPC
aliyun vpc DescribeVSwitches --RegionId --VpcId vpc-xxx # VSwitch(记录ZoneId)
aliyun ecs DescribeSecurityGroups --RegionId --VpcId vpc-xxx --SecurityGroupType normal # 安全组
aliyun ecs DescribeKeyPairs --RegionId # SSH密钥对

EMR不支持企业安全组,仅支持普通安全组——传入错误类型会直接导致创建失败。

CLI调用

bash
aliyun emr --RegionId [--param value ...]

  • - API版本 2021-03-20(CLI自动),RPC风格
  • User-Agent:所有CLI调用必须携带 --user-agent AlibabaCloud-Agent-Skills 用于来源追踪。Python SDK和Terraform配置见 user-agent.md
bash aliyun emr GetCluster --RegionId cn-hangzhou --ClusterId c-xxx \ --user-agent AlibabaCloud-Agent-Skills
  • - 两种参数传递格式(必须根据API使用正确格式):

### 参数传递格式

EMR API使用两种不同的参数格式。使用错误的格式会导致错误。

格式1:RunCluster(JSON字符串格式) — ✅ 推荐用于集群创建

- 使用时机:仅RunCluster API
- 格式:复杂参数(数组、对象)以JSON字符串形式传递,用单引号包裹
- 简单参数:无引号的纯值

bash
# 展示参数格式的模板(根据需求替换值)
aliyun emr RunCluster --RegionId \
--ClusterName \
--ClusterType \ # DATALAKE/OLAP/DATAFLOW/DATASERVING/CUSTOM
--ReleaseVersion \ # 先通过ListReleaseVersions查询
--DeployMode \ # NORMAL/HA(默认:NORMAL)
--PaymentType \ # PayAsYouGo/Subscription(默认:PayAsYouGo)
--Applications [{ApplicationName:},{ApplicationName:}] \ # JSON数组
--NodeAttributes {VpcId:,ZoneId:,SecurityGroupId:} \ # JSON对象
--NodeGroups [{NodeGroupType:MASTER,NodeGroupName:master,NodeCount:1,InstanceTypes:[],VSwitchIds:[],SystemDisk:{Category:cloudessd,Size:120},DataDisks:[{Category:cloudessd,Size:80,Count:1}]}] \ # JSON数组
--ClientToken $(uuidgen) \ # 通过以下命令生成:uuidgen | tr -d \n(见下方ClientToken部分)
--user-agent AlibabaCloud-Agent-Skills

关键参数名称(常见错误):
- ✅ ReleaseVersion — ❌ 不是 EmrVersion 或 Version
- ✅ DeployMode — ❌ 不是 DeploymentMode 或 DeployModeType
- ✅ InstanceTypes(数组)— ❌

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 alibabacloud-emr-cluster-manage-1775915590 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 alibabacloud-emr-cluster-manage-1775915590 技能

通过命令行安装

skillhub install alibabacloud-emr-cluster-manage-1775915590

下载

⬇ 下载 alibabacloud-emr-cluster-manage v0.0.2(免费)

文件大小: 40.03 KB | 发布时间: 2026-4-12 08:51

v0.0.2 最新 2026-4-12 08:51
**Cluster deletion is now explicitly prohibited; improved error handling and parameter validation.**

- Cluster deletion, release, and termination are now strictly not supported—any such requests are refused and redirected to the EMR console.
- Strengthened error recovery: On API errors, you must consult `references/error-recovery.md` before any retry; blind retries are prohibited.
- Added explicit requirement to verify all command parameters and formats against documentation before execution.
- Expanded and clarified user-agent guidance for all invocation scenarios and provided a dedicated reference (`references/user-agent.md`).
- Documentation improvements: Enhanced sample code, more rigorous execution principles, stricter workflow confirmations, and explicit parameter format instructions.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部