返回顶部
c

cluster数据聚类分析

Perform data clustering analysis using k-means and hierarchical algorithms. Use when you need to group, classify, or segment datasets.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
177
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

cluster

Cluster — 数据聚类分析工具

Cluster 是一款命令行数据聚类分析工具,支持 k-means 和层次聚类算法。它可以从 CSV/JSONL 源读取数值数据,执行聚类分析,评估聚类质量,并导出结果。

数据以 JSONL 记录形式存储在 ~/.cluster/data.jsonl 中。每条记录代表一次聚类运行,包含其参数、分配结果、质心和评估指标。

前置条件

  • - Python 3.8+ 及标准库(基本操作无需外部包)
  • bash shell

命令

run

对输入数据运行聚类算法。

环境变量:

  • - INPUT(必需)— 包含数值数据的输入 CSV/JSONL 文件路径
  • K — 聚类数量(默认:3)
  • ALGORITHM — 使用的算法:kmeans 或 hierarchical(默认:kmeans)
  • MAX_ITER — k-means 的最大迭代次数(默认:100)
  • SEED — 用于可重复性的随机种子

示例:
bash
INPUT=/path/to/data.csv K=5 ALGORITHM=kmeans bash scripts/script.sh run

assign

将新的数据点分配到先前运行的现有聚类中。

环境变量:

  • - RUN_ID(必需)— 要使用的聚类运行 ID
  • INPUT(必需)— 新数据点路径(CSV/JSONL)

示例:
bash
RUNID=abc123 INPUT=/path/to/newdata.csv bash scripts/script.sh assign

centroids

显示或导出聚类运行的质心坐标。

环境变量:

  • - RUN_ID(必需)— 聚类运行的 ID
  • FORMAT — 输出格式:table、json、csv(默认:table)

evaluate

使用轮廓系数、惯性和 Davies-Bouldin 指数评估聚类质量。

环境变量:

  • - RUN_ID(必需)— 要评估的聚类运行 ID

visualize

生成基于文本或 ASCII 的聚类分配可视化。

环境变量:

  • - RUN_ID(必需)— 聚类运行的 ID
  • DIMS — 要绘制的维度,逗号分隔(默认:前两个)

export

将聚类结果导出到文件。

环境变量:

  • - RUN_ID(必需)— 要导出的运行 ID
  • OUTPUT — 输出文件路径(默认:标准输出)
  • FORMAT — 导出格式:json、csv、jsonl(默认:json)

import

导入先前导出的聚类运行。

环境变量:

  • - INPUT(必需)— 要导入的文件路径

config

查看或更新配置设置。

环境变量:

  • - KEY — 要设置的配置键
  • VALUE — 配置值

list

列出所有存储的聚类运行及其摘要信息。

环境变量:

  • - LIMIT — 最大显示运行数(默认:20)
  • SORT — 排序字段:date、k、score(默认:date)

stats

显示所有聚类运行的汇总统计信息。

help

显示使用信息和可用命令。

version

显示当前 cluster 工具的版本。

数据存储

所有聚类运行存储在 ~/.cluster/data.jsonl 中。每行是一个 JSON 对象,包含以下字段:

  • - id — 唯一运行标识符
  • timestamp — ISO 8601 创建时间
  • algorithm — 使用的算法
  • k — 聚类数量
  • centroids — 质心坐标列表
  • assignments — 数据点索引到聚类 ID 的映射
  • metrics — 评估指标(轮廓系数、惯性等)
  • inputfile — 源数据文件路径
  • numpoints — 聚类的数据点数量

配置

配置存储在 ~/.cluster/config.json 中。可用键:

  • - defaultk — 默认聚类数量(默认:3)
  • defaultalgorithm — 默认算法(默认:kmeans)
  • maxiterations — 默认最大迭代次数(默认:100)
  • randomseed — 默认随机种子(默认:42)



由 BytesAgain 提供支持 | bytesagain.com | hello@bytesagain.com

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 cluster-1776169924 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 cluster-1776169924 技能

通过命令行安装

skillhub install cluster-1776169924

下载

⬇ 下载 cluster v1.0.0(免费)

文件大小: 7.9 KB | 发布时间: 2026-4-17 14:25

v1.0.0 最新 2026-4-17 14:25
publish v1.0.0

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部