返回顶部
D

Datasets数据集浏览

Browse and load ready-to-use AI/ML datasets with fast manipulation. Use when searching datasets, loading training data, transforming formats.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 2.0.0
安全检测
已通过
174
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

Datasets

数据集

一个用于从命令行摄取、转换、查询和管理数据集条目的数据处理工具包。所有操作均带有时间戳记录并存储在本地。

命令

数据操作

每个数据命令有两种工作模式:不带参数运行可查看最近条目,或传递输入以记录新条目。

命令描述
datasets ingest <输入>摄取数据 — 记录新的摄取条目或查看最近条目
datasets transform <输入>
转换数据 — 记录转换操作或查看最近条目 |
| datasets query <输入> | 查询数据 — 记录查询或查看最近条目 |
| datasets filter <输入> | 过滤数据 — 记录过滤操作或查看最近条目 |
| datasets aggregate <输入> | 聚合数据 — 记录聚合操作或查看最近条目 |
| datasets visualize <输入> | 可视化数据 — 记录可视化操作或查看最近条目 |
| datasets export <输入> | 导出数据 — 记录导出条目或查看最近条目 |
| datasets sample <输入> | 采样数据 — 记录采样或查看最近条目 |
| datasets schema <输入> | 模式管理 — 记录模式条目或查看最近条目 |
| datasets validate <输入> | 验证数据 — 记录验证操作或查看最近条目 |
| datasets pipeline <输入> | 管道管理 — 记录管道步骤或查看最近条目 |
| datasets profile <输入> | 分析数据 — 记录分析或查看最近条目 |

实用命令

命令描述
datasets stats显示汇总统计 — 每类条目数、总条目数、磁盘使用量
datasets export <格式>
将所有数据导出到文件(格式:json、csv、txt) | | datasets search <词条> | 在所有日志文件中搜索词条(不区分大小写) | | datasets recent | 显示活动历史中最近20条条目 | | datasets status | 健康检查 — 版本、数据目录、条目数、磁盘使用量、最近活动 | | datasets help | 显示可用命令 | | datasets version | 显示版本(v2.0.0) |

数据存储

所有数据本地存储在 ~/.local/share/datasets/:

  • - 每个数据命令写入其自己的日志文件(例如 ingest.log、transform.log)
  • 条目存储为 时间戳|值 对(管道符分隔)
  • 所有操作在 history.log 中记录并带有时间戳
  • 导出在数据目录中生成文件(export.json、export.csv 或 export.txt)

要求

  • - Bash(使用 set -euo pipefail)
  • 标准Unix工具:date、wc、du、grep、tail、cat、sed
  • 无需外部依赖或API密钥

使用场景

  • - 记录和跟踪数据处理操作(摄取、转换、查询等)
  • 维护可搜索的数据管道活动历史
  • 以JSON、CSV或纯文本格式导出累积的记录
  • 作为更大自动化或数据管道工作流程的一部分
  • 当需要轻量级、仅本地的数据集操作跟踪器时

示例

bash

记录新的摄取条目


datasets ingest 已加载 training_data.csv 10000行

查看最近的转换条目

datasets transform

记录查询

datasets query 按日期 > 2026-01-01 过滤

在所有日志中搜索

datasets search training

以JSON格式导出所有内容

datasets export json

检查总体统计信息

datasets stats

查看最近活动

datasets recent

健康检查

datasets status
由BytesAgain提供 | bytesagain.com | hello@bytesagain.com 💬 反馈与功能请求:https://bytesagain.com/feedback

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 datasets-1776125702 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 datasets-1776125702 技能

通过命令行安装

skillhub install datasets-1776125702

下载

⬇ 下载 Datasets v2.0.0(免费)

文件大小: 4.09 KB | 发布时间: 2026-4-17 14:36

v2.0.0 最新 2026-4-17 14:36
publish v2.0.0

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部