返回顶部
l

llmfit-advisor硬件适配推荐

Detect local hardware (RAM, CPU, GPU/VRAM) and recommend the best-fit local LLM models with optimal quantization, speed estimates, and fit scoring.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 0.2.2
安全检测
已通过
933
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

llmfit-advisor

llmfit-advisor

硬件感知的本地LLM顾问。检测您的系统规格(内存、CPU、GPU/显存),并推荐实际适配的模型,提供最佳量化方案和速度估算。

使用时机(触发短语)

当用户提出以下任一问题时,立即使用此技能:

  • - 我能运行哪些本地模型?
  • 哪些LLM适合我的硬件?
  • 推荐一个本地模型
  • 我的GPU最适合什么模型?
  • 我能在本地运行Llama 70B吗?
  • 配置本地模型
  • 设置Ollama模型
  • 哪些模型适合我的显存?
  • 帮我选一个用于编程的本地模型

在以下情况也使用此技能:

  • - 用户想要配置 models.providers.ollama 或 models.providers.lmstudio
  • 用户提到在本地运行模型,你需要知道哪些模型适配
  • 需要模型推荐,且用户具备本地推理能力(Ollama、vLLM、LM Studio)

快速开始

检测硬件

bash
llmfit --json system

返回包含CPU、内存、GPU名称、显存、多GPU信息以及内存是否统一(Apple Silicon)的JSON数据。

获取最佳推荐

bash
llmfit recommend --json --limit 5

返回按综合评分(质量、速度、适配度、上下文)排名前5的模型,并针对检测到的硬件提供最佳量化方案。

按使用场景筛选

bash
llmfit recommend --json --use-case coding --limit 3
llmfit recommend --json --use-case reasoning --limit 3
llmfit recommend --json --use-case chat --limit 3

有效使用场景:general(通用)、coding(编程)、reasoning(推理)、chat(聊天)、multimodal(多模态)、embedding(嵌入)。

按最低适配等级筛选

bash
llmfit recommend --json --min-fit good --limit 10

有效适配等级(从好到差):perfect(完美)、good(良好)、marginal(勉强)。

理解输出结果

系统JSON

json
{
system: {
cpu_name: Apple M2 Max,
cpu_cores: 12,
totalramgb: 32.0,
availableramgb: 24.5,
has_gpu: true,
gpu_name: Apple M2 Max,
gpuvramgb: 32.0,
gpu_count: 1,
backend: Metal,
unified_memory: true
}
}

推荐JSON

models数组中的每个模型包含:

字段含义
nameHuggingFace模型ID(例如 meta-llama/Llama-3.1-8B-Instruct)
provider
模型提供商(Meta、阿里巴巴、Google等) |
| params_b | 参数量(十亿) |
| score | 综合评分0–100(越高越好) |
| score_components | 评分细分:quality(质量)、speed(速度)、fit(适配度)、context(上下文)(各0–100) |
| fit_level | Perfect(完美)、Good(良好)、Marginal(勉强)或 TooTight(太紧) |
| run_mode | GPU(GPU)、CPU+GPU Offload(CPU+GPU卸载)或 CPU Only(仅CPU) |
| bestquant | 针对硬件的最佳量化方案(例如 Q5KM、Q4K_M) |
| estimated_tps | 预估每秒token数 |
| memoryrequiredgb | 此量化方案所需的显存/内存(GB) |
| memoryavailablegb | 检测到的可用显存/内存(GB) |
| utilization_pct | 模型占用可用内存的百分比 |
| use_case | 模型设计用途 |
| context_length | 最大上下文窗口 |

适配等级说明

  • - Perfect(完美):模型适配良好,且有富余空间。理想选择。
  • Good(良好):模型适配,但占用大部分可用内存。运行效果良好。
  • Marginal(勉强):模型勉强适配。可能可以运行,但预计性能较慢或上下文受限。
  • TooTight(太紧):模型不适配。不推荐。

运行模式说明

  • - GPU:完全GPU推理。速度最快。模型权重完全加载到显存中。
  • CPU+GPU Offload(CPU+GPU卸载):部分层在GPU上运行,其余在系统内存中。速度比纯GPU慢。
  • CPU Only(仅CPU):所有推理在CPU上使用系统内存运行。速度最慢,但无需GPU即可运行。

使用结果配置OpenClaw

获取推荐后,配置用户的本地模型提供商。

针对Ollama

将HuggingFace模型名称映射到其Ollama标签。常见映射:

llmfit名称Ollama标签
meta-llama/Llama-3.1-8B-Instructllama3.1:8b
meta-llama/Llama-3.3-70B-Instruct
llama3.3:70b |
| Qwen/Qwen2.5-Coder-7B-Instruct | qwen2.5-coder:7b |
| Qwen/Qwen2.5-72B-Instruct | qwen2.5:72b |
| deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct | deepseek-coder-v2:16b |
| deepseek-ai/DeepSeek-R1-Distill-Qwen-32B | deepseek-r1:32b |
| google/gemma-2-9b-it | gemma2:9b |
| mistralai/Mistral-7B-Instruct-v0.3 | mistral:7b |
| microsoft/Phi-3-mini-4k-instruct | phi3:mini |
| microsoft/Phi-4-mini-instruct | phi4-mini |

然后更新 openclaw.json:

json
{
models: {
providers: {
ollama: {
models: [ollama/]
}
}
}
}

并可选择设置为默认:

json
{
agents: {
defaults: {
model: {
primary: ollama/
}
}
}
}

针对vLLM / LM Studio

直接使用HuggingFace模型名称作为模型标识符,并加上相应的提供商前缀(vllm/ 或 lmstudio/)。

工作流程示例

当用户询问我能运行哪些本地模型?时:

  1. 1. 运行 llmfit --json system 显示硬件摘要
  2. 运行 llmfit recommend --json --limit 5 获取最佳推荐
  3. 展示带评分和适配等级的推荐结果
  4. 如果用户想配置某个模型,将其映射到相应的Ollama/vLLM/LM Studio标签
  5. 提供更新 openclaw.json 并添加所选模型的选项

当用户询问特定使用场景,如推荐一个编程模型时:

  1. 1. 运行 llmfit recommend --json --use-case coding --limit 3
  2. 展示编程相关的推荐结果
  3. 提供通过Ollama拉取并配置的选项

注意事项

  • - llmfit可检测NVIDIA GPU(通过nvidia-smi)、AMD GPU(通过rocm-smi)和Apple Silicon(统一内存)。
  • 多GPU设置会自动聚合各显卡的显存。
  • bestquant 字段指示最佳量化方案——如果显存允许,更高的量化等级(Q6K、Q80)意味着更好的质量。
  • 速度估算(estimatedtps)为近似值,因硬件和量化方案而异。
  • fit_level: TooTight 的模型绝不应推荐给用户。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 llmfit-1776420065 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 llmfit-1776420065 技能

通过命令行安装

skillhub install llmfit-1776420065

下载

⬇ 下载 llmfit-advisor v0.2.2(免费)

文件大小: 3.25 KB | 发布时间: 2026-4-17 18:37

v0.2.2 最新 2026-4-17 18:37
- Updated the Homebrew install instructions and formula path in the skill metadata.
- No functional or documentation changes beyond the installation method update.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部