返回顶部
a

apple-silicon-ai苹果芯片AI集群

Apple Silicon AI — run LLMs, image generation, speech-to-text, and embeddings on Mac Studio, Mac Mini, MacBook Pro, and Mac Pro. Turn your Apple Silicon devices into a local AI fleet. M1, M2, M3, M4 Max and Ultra chips with unified memory make these machines ideal for local inference. No cloud APIs, no GPU rentals — your Macs are the cluster. 苹果芯片AI本地推理集群。IA Apple Silicon para inferencia local.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
164
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

apple-silicon-ai

Apple Silicon AI — 你的Mac就是集群

将你的Mac Studio、Mac Mini、MacBook Pro或Mac Pro转变为一个本地Apple Silicon AI集群。一个端点即可将LLM推理、图像生成、语音转文本和嵌入任务路由到网络中的每一台Apple Silicon设备。

无需云API。无需租用GPU。无需Docker。你的Apple Silicon M1/M2/M3/M4芯片搭配统一内存,其推理硬件性能已超越大多数云实例——你只需要一款能将它们视为Apple Silicon集群的软件。

为什么选择Apple Silicon做AI

Apple Silicon统一内存将整个模型保存在一个地址空间中——没有PCIe瓶颈,没有CPU-GPU传输开销。搭载M4 Ultra和256GB内存的Mac Studio可以运行需要多块NVIDIA A100才能运行的120B参数模型。这就是Apple Silicon的优势。

Apple Silicon芯片统一内存LLM最佳适配Apple Silicon图像生成备注
M1 (8GB)8GB7B模型入门级Apple Silicon
M1 Pro/Max (32-64GB)
32-64GB | 14B-32B | 可用 | Apple Silicon MacBook Pro |
| M2 Ultra (192GB) | 192GB | 70B-120B | 快 | Apple Silicon Mac Studio/Pro |
| M3 Max (128GB) | 128GB | 70B | 快 | 最新Apple Silicon MacBook Pro |
| M4 Max (128GB) | 128GB | 70B | 快 | Apple Silicon Mac Studio,最新一代 |
| M4 Ultra (256GB) | 256GB | 120B+ | 非常快 | Apple Silicon Mac Studio/Pro,最大模型 |

Apple Silicon集群设置

1. 在每台Apple Silicon Mac上安装

bash
pip install ollama-herd # Apple Silicon优化推理路由器

2. 启动Apple Silicon路由器(选择一台Mac)

bash
herd # 在端口11435上启动Apple Silicon路由器

3. 在每台Mac上启动Apple Silicon节点代理

bash
herd-node # Apple Silicon节点自动发现路由器

就这样。Apple Silicon节点会在本地网络上自动发现路由器。无需配置IP地址,无需配置文件。如需显式连接,请使用herd-node --router-url http://:11435。

Apple Silicon路由工作原理

MacBook Pro (M3 Max, 64GB) ─┐
Mac Mini (M4, 32GB) ├──→ Apple Silicon路由器 (:11435) ←── 你的应用
Mac Studio (M4 Ultra, 256GB) ─┘

Apple Silicon路由器根据7个信号对每台设备进行评分,并将每个请求路由到最佳可用Mac——热状态、内存适配度、队列深度等。

Apple Silicon LLM推理

在你的Apple Silicon集群上运行Llama、Qwen、DeepSeek、Phi、Mistral、Gemma以及任何Ollama模型。

OpenAI兼容API(Apple Silicon后端)

bash
curl http://localhost:11435/v1/chat/completions \
-H Content-Type: application/json \
-d {
model: llama3.3:70b,
messages: [{role: user, content: 解释Apple Silicon统一内存架构}]
}

Ollama兼容API

bash
curl http://localhost:11435/api/chat \
-d {model: qwen3:32b, messages: [{role: user, content: 比较Apple Silicon M4与M3在AI推理方面的表现}]}

Apple Silicon Python客户端

python
from openai import OpenAI

Apple Silicon推理客户端


applesiliconclient = OpenAI(baseurl=http://localhost:11435/v1, apikey=unused)
applesiliconresponse = applesiliconclient.chat.completions.create(
model=deepseek-r1:70b,
messages=[{role: user, content: 为Apple Silicon优化此函数}]
)

Apple Silicon图像生成(mflux)

使用MLX原生Flux模型生成图像。原生运行于Apple Silicon——无需CUDA,无需云端。

bash
curl http://localhost:11435/api/generate-image \
-d {prompt: Apple Silicon Mac Studio渲染AI艺术,照片级真实感, model: z-image-turbo, width: 512, height: 512}

Apple Silicon图像生成性能:

  • - Mac Studio M4 Ultra:512px约5秒,1024px约14秒
  • MacBook Pro M3 Max:512px约7秒,1024px约18秒
  • Mac Mini M4:512px约12秒,1024px约30秒

Apple Silicon语音转文本(Qwen ASR)

使用通过MLX运行的Qwen3-ASR在Apple Silicon上本地转录音频。会议、语音笔记、播客——无需云端,无需Whisper API费用。

bash
curl http://localhost:11435/api/transcribe \
-F file=@applesiliconmeeting.wav \
-F model=qwen3-asr

支持WAV、MP3、M4A、FLAC格式。在Apple Silicon M4 Ultra上,30秒片段约需2秒。

Apple Silicon嵌入

使用Ollama嵌入模型(nomic-embed-text、mxbai-embed-large、snowflake-arctic-embed)在你的Apple Silicon集群上嵌入文档。

bash
curl http://localhost:11435/api/embed \
-d {model: nomic-embed-text, input: Apple Silicon统一内存架构用于AI推理}

跨Apple Silicon节点批量处理数千个文档,而不是在单台Mac上形成瓶颈。

Apple Silicon集群监控

仪表盘

打开http://localhost:11435/dashboard——查看集群中每台Apple Silicon Mac:加载的模型、队列深度、热状态、内存使用情况和健康状态。

Apple Silicon集群状态API

bash
curl http://localhost:11435/fleet/status

返回每个Apple Silicon节点的硬件规格、加载的模型、图像/STT能力和健康指标。

Apple Silicon健康检查

bash
curl http://localhost:11435/dashboard/api/health

15项自动检查:离线Apple Silicon节点、内存压力、热节流、VRAM回退、错误率等。

按Apple Silicon硬件推荐的模型

你的Apple Silicon Mac内存推荐模型
Mac Mini (16GB)16GBllama3.2:3b, phi4-mini, nomic-embed-text
Mac Mini (32GB)
32GB | qwen3:14b, deepseek-r1:14b, llama3.3:8b | | MacBook Pro (36-64GB) | 36-64GB | qwen3:32b, deepseek-r1:32b, codestral | | Mac Studio (128GB) | 128GB | llama3.3:70b, qwen3:72b, deepseek-r1:70b | | Mac Studio/Pro (192-256GB) | 192-256GB | qwen3:110b, deepseek-v3:236b (量化) |

Apple Silicon路由器的模型推荐器会分析你的集群硬件并建议最佳模型组合:GET /dashboard/api/model-recommendations。

完整文档

安全护栏

  • - 无自动下载:Apple Silicon模型拉取始终由用户发起,需要明确确认。下载大小从2GB到70GB+不等,取决于模型大小。
  • 删除模型需要确认:未经用户明确批准,绝不从Apple Silicon节点移除模型。
  • 所有Apple Silicon请求保持本地:无数据离开你的本地网络——所有推理都在你的Apple Silicon Mac上完成。
  • 无需API密钥:你的Apple Silicon集群无需账户、无需令牌、无需云依赖。
  • 无外部网络访问:Apple Silicon路由器和节点仅在你的本地网络上通信。无遥测、无云回调

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 apple-silicon-ai-1775927667 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 apple-silicon-ai-1775927667 技能

通过命令行安装

skillhub install apple-silicon-ai-1775927667

下载

⬇ 下载 apple-silicon-ai v1.0.3(免费)

文件大小: 3.9 KB | 发布时间: 2026-4-12 09:01

v1.0.3 最新 2026-4-12 09:01
Cross-platform support: macOS, Linux, and Windows. Updated OS metadata, descriptions, and hardware recommendations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部