返回顶部
g

gemma-gemma3Gemma3本地部署

Gemma 3 by Google — run Gemma 3 (4B, 12B, 27B) across your local device fleet. Google's most capable open model with 128K context, strong coding, and multilingual support. Fleet-routed to the best available machine via Ollama Herd. Cross-platform (macOS, Linux, Windows). Zero cloud costs.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.1
安全检测
已通过
154
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

gemma-gemma3

Gemma 3 — 在你的设备集群中运行谷歌开源模型

Gemma 3 是谷歌最强大的开源大语言模型系列。支持128K上下文窗口,强大的编码性能,覆盖140多种语言的多语言支持。集群路由器会为每个请求自动选择最佳设备——无需手动负载均衡。

支持的Gemma模型

模型参数量Ollama名称最佳用途
Gemma 3 27B270亿gemma3:27b最高质量——可与更大模型媲美
Gemma 3 12B
120亿 | gemma3:12b | 质量与速度均衡 | | Gemma 3 4B | 40亿 | gemma3:4b | 快速,可在低内存设备上运行 | | Gemma 3 1B | 10亿 | gemma3:1b | 超轻量,即时响应 | | CodeGemma 7B | 70亿 | codegemma | 专注代码的变体 |

快速开始

bash
pip install ollama-herd # PyPI: https://pypi.org/project/ollama-herd/
herd # 启动路由器(端口11435)
herd-node # 在每个设备上运行——自动发现路由器

安装过程中不会下载任何模型。模型会在请求到达时按需拉取,或通过仪表盘手动拉取。所有拉取操作都需要用户确认。

通过集群使用Gemma

OpenAI SDK(即插即用替代方案)

python
from openai import OpenAI

client = OpenAI(baseurl=http://localhost:11435/v1, apikey=not-needed)

Gemma 3 27B 用于复杂推理

response = client.chat.completions.create( model=gemma3:27b, messages=[{role: user, content: 向10岁孩子解释量子纠缠}], stream=True, ) for chunk in response: print(chunk.choices[0].delta.content or , end=)

使用CodeGemma生成代码

python
response = client.chat.completions.create(
model=codegemma,
messages=[{role: user, content: 用Rust编写一个包含插入、删除和搜索功能的二叉搜索树}],
)
print(response.choices[0].message.content)

curl(Ollama格式)

bash

Gemma 3 27B


curl http://localhost:11435/api/chat -d {
model: gemma3:27b,
messages: [{role: user, content: 翻译成日语:今天天气真好}],
stream: false
}

curl(OpenAI格式)

bash
curl http://localhost:11435/v1/chat/completions \
-H Content-Type: application/json \
-d {model: gemma3:4b, messages: [{role: user, content: 你好}]}

为你的硬件选择合适的Gemma

跨平台: 以下为示例配置。任何具有同等内存的设备(Mac、Linux、Windows)均可运行。集群路由器支持所有平台。

设备内存最佳Gemma模型
MacBook Air(8GB)8GBgemma3:1b — 即时响应
Mac Mini(16GB)
16GB | gemma3:4b — 同尺寸中表现强劲 | | Mac Mini(24GB) | 24GB | gemma3:12b — 极佳平衡 | | MacBook Pro(36GB) | 36GB | gemma3:27b — 全功率 | | Mac Studio(64GB+) | 64GB+ | gemma3:27b + codegemma 同时运行 |

为什么在本地运行Gemma

  • - 128K上下文 — 处理整个代码库和长文档
  • 140+种语言 — 无需切换模型即可支持多语言
  • 谷歌品质,零成本 — 硬件之外无按token计费
  • 隐私保护 — 所有数据保留在你的网络中
  • 集群路由 — 多台机器分担负载

查看运行状态

bash

已加载到内存中的模型


curl -s http://localhost:11435/api/ps | python3 -m json.tool

集群健康状态

curl -s http://localhost:11435/dashboard/api/health | python3 -m json.tool

Web仪表盘地址:http://localhost:11435/dashboard — 实时监控。

该集群还提供以下功能

其他大语言模型

Llama 3.3、Qwen 3.5、DeepSeek-V3、DeepSeek-R1、Phi 4、Mistral、Codestral — 使用同一端点。

图像生成

bash curl -o image.png http://localhost:11435/api/generate-image \ -d {model: z-image-turbo, prompt: 一颗捕捉光线的宝石, width: 1024, height: 1024}

语音转文字

bash curl http://localhost:11435/api/transcribe -F file=@meeting.wav -F model=qwen3-asr

嵌入向量

bash curl http://localhost:11435/api/embed \ -d {model: nomic-embed-text, input: Google Gemma开源语言模型}

完整文档

贡献

Ollama Herd是开源项目(MIT协议)。欢迎来自人类和AI代理的Star、Issue和PR:

  • - GitHub — 444个测试,完全异步,CLAUDE.md让AI代理立即高效工作
  • 发现Bug?提交Issue
  • 想添加功能?Fork、分支、PR — 测试套件运行时间不到40秒

安全护栏

  • - 模型下载需要用户明确确认 — Gemma模型大小从1GB(1B)到16GB(27B)不等。
  • 模型删除需要用户明确确认。
  • 切勿删除或修改~/.fleet-manager/目录中的文件。
  • 不会自动下载任何模型——所有拉取操作均由用户发起,或需要通过auto_pull选择加入。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 gemma-gemma3-1775921650 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 gemma-gemma3-1775921650 技能

通过命令行安装

skillhub install gemma-gemma3-1775921650

下载

⬇ 下载 gemma-gemma3 v1.0.1(免费)

文件大小: 3.15 KB | 发布时间: 2026-4-12 10:05

v1.0.1 最新 2026-4-12 10:05
Cross-platform support: macOS, Linux, and Windows. Updated OS metadata, descriptions, and hardware recommendations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部