返回顶部
t

tinker修补匠

>

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
83
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

tinker

技能名称: tinker
详细描述:

Tinker SDK 技能

Tinker 是 Thinking Machines AI 开发的一个机器学习平台 SDK,用于管理训练运行、模型检查点和微调工作流。本技能涵盖 CLI、Python SDK 以及 tinker-cookbook 训练配方。

源代码仓库:

  • - SDK: https://github.com/thinking-machines-lab/tinker
  • Cookbook: https://github.com/thinking-machines-lab/tinker-cookbook
  • 本技能: https://github.com/zjrwtx/max_skills

重要 — 始终使用最新版本:
在运行任何 Tinker 命令或 cookbook 配方之前,请确保已安装最新版本:
bash
uv pip install --upgrade tinker

对于 cookbook,拉取最新版本并重新安装:


cd && git pull && uv pip install -e .

当您需要关于 API 内部实现、配方实现或 SDK 源代码的更详细信息时,请始终从这些仓库查看最新代码 — 不要依赖缓存或过时的知识。直接克隆或浏览这些仓库以获取最新的 API 和选项。

快速开始

身份验证

bash

选项 1: 环境变量(推荐)


export TINKERAPIKEY=your-api-key

选项 2: 配置文件 (~/.tinker/config.json)

mkdir -p ~/.tinker echo {api_key: your-api-key} > ~/.tinker/config.json

验证安装

bash
tinker version
tinker run list --limit 3

Tinker 路径格式

所有检查点操作都使用 tinker 路径:

tinker:////

  • - TYPE: weights(训练)或 sampler_weights(采样器)
  • 示例: tinker://run-abc123/weights/00040

CLI 命令

全局选项

  • - --format [table|json] 或 -f — 输出格式(默认: table)
  • -h / --help — 任何命令的帮助信息

运行命令

bash

列出训练运行(默认: 20,使用 --limit=0 获取全部)


tinker run list [--limit N] [-c COLUMNS]

可用列:

id, model, owner, lora, updated, status,

checkpoint, checkpoint_time

默认列: id, model, lora, updated, status

显示特定运行的详细信息

tinker run info

检查点命令

bash

列出检查点(所有运行,或通过 --run-id 过滤)


tinker checkpoint list [--run-id ID] [--limit N]

显示检查点详细信息

tinker checkpoint info

下载并本地解压检查点

tinker checkpoint download \ [-o OUTPUT_DIR] [--force]

切换公共访问权限

tinker checkpoint publish tinker checkpoint unpublish

设置或移除过期时间(TTL,单位秒)

tinker checkpoint set-ttl --ttl 604800 tinker checkpoint set-ttl --remove

删除检查点(按路径或按过滤条件)

tinker checkpoint delete [PATH2 ...] [-y] tinker checkpoint delete --run-id \ [--type weights|sampler_weights] \ [--before DATE] [--after DATE] [-y]

推送检查点到 HuggingFace Hub

tinker checkpoint push-hf \ [-r REPO_ID] [--public] [--revision REV] \ [--commit-message MSG] [--create-pr] \ [--allow-pattern PAT] [--ignore-pattern PAT] \ [--no-model-card]

有关完整的标志详细信息和输出格式示例,请阅读 references/cli-reference.md。


常见工作流

1. 查找并下载检查点

bash

步骤 1: 查找您的训练运行


tinker run list

步骤 2: 检查运行详情

tinker run info

步骤 3: 列出可用的检查点

tinker checkpoint list --run-id

步骤 4: 下载

tinker checkpoint download \ tinker:///weights/ \ -o ./models/ --force

2. 推送检查点到 HuggingFace

bash

先决条件: 使用 HF 进行身份验证


pip install huggingface_hub && hf auth login

作为公共 PEFT 适配器推送

tinker checkpoint push-hf \ tinker://ID>/samplerweights/ \ -r myorg/my-lora --public

或者创建 PR 而不是直接推送

tinker checkpoint push-hf \ tinker://ID>/samplerweights/ \ -r myorg/my-lora --create-pr

3. 清理旧检查点

bash

删除某个日期之前的检查点


tinker checkpoint delete --run-id \
--type weights --before 2025-01-01 -y

删除特定检查点

tinker checkpoint delete \ tinker:///weights/0001 \ tinker:///weights/0002 -y

4. 使用 JSON 输出编写脚本

bash

将所有运行导出为 JSON


tinker --format json run list --limit=0 > runs.json

使用 jq 解析

jq .runs[].trainingrunid runs.json

批量列出每个运行的检查点

for rid in $(jq -r .runs[].trainingrunid runs.json) do tinker --format json checkpoint list --run-id $rid done

Cookbook 配方

tinker-cookbook 提供即用型训练配方。仓库: https://github.com/thinking-machines-lab/tinker-cookbook

配方架构

每个配方都遵循相同的模式:

python
import chz
from tinker_cookbook.rl import train # 或 supervised

1. 通过 chz.Blueprint 构建类型化配置

def buildconfigblueprint() -> chz.Blueprint[train.Config]: return chz.Blueprint(train.Config).apply({ model_name: meta-llama/Llama-3.1-8B, learning_rate: 2e-4, ... })

2. 运行训练循环

def main(config): asyncio.run(train.main(config))

3. 带有 chz 覆盖的 CLI 入口点

if name == main: bp = buildconfigblueprint() bp.makefromargv(sys.argv[1:]) main(bp.make())

从命令行覆盖任何配置字段:
bash
python -m tinkercookbook.recipes.slbasic \
--model_name Qwen/Qwen3-8B \
--learning_rate 1e-4 \
--log_path /tmp/my-run

运行 SFT(监督微调)

bash

在 NoRobots 数据集上进行最小化 SFT


python -m tinkercookbook.recipes.slbasic

使用自定义数据集(对话的 JSONL 格式)

编辑 sl_basic.py 以使用 FromConversationFileBuilder:

file_path=/path/to/conversations.jsonl

格式: 与 example_data/conversations.jsonl 相同

运行 RL 训练

bash

在 GSM8K 上进行数学 RL


python -m tinkercookbook.recipes.rlbasic

覆盖超参数

python -m tinkercookbook.recipes.rlbasic \ --learning_rate 4e-5 \ --max_tokens 256

可用配方

配方类型用例
slbasicSFT最小化 SFT 模板
rlbasic
RL | 最小化 RL 模板 | | chat_sl/ | SFT | 对话 (Tulu3) | | math_rl/ | RL | 数学推理 (GSM8K) | | code_rl/ | RL | 代码(沙盒执行) | | preference/ | RLHF | SFT → 奖励 → RL | | search_tool/ | RL | 检索工具使用 | | distillation/ | SFT/RL | 教师→学生 | | prompt_dist

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 tinker-rlskill-1775988008 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 tinker-rlskill-1775988008 技能

通过命令行安装

skillhub install tinker-rlskill-1775988008

下载

⬇ 下载 tinker v1.0.1(免费)

文件大小: 15.11 KB | 发布时间: 2026-4-13 12:22

v1.0.1 最新 2026-4-13 12:22
- Added source URL for this skill: https://github.com/zjrwtx/max_skills
- No functional changes; documentation now lists this skill's repository alongside SDK and cookbook sources.

Archiver·手机版·闲社网·闲社论坛·智能体自动化市场· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2026 闲社网·AI智能体论坛·AI自动化解决方案·http://xianshe.com

p2p_official_large
返回顶部