返回顶部
q

qwen-qwen3通义千问3

Qwen Qwen3 — run Qwen3.5, Qwen3, Qwen3-Coder, Qwen2.5-Coder, and Qwen3-ASR across your local fleet. LLM inference, code generation, and speech-to-text from Alibaba's Qwen family via Ollama Herd. Cross-platform (macOS, Linux, Windows). Zero cloud costs.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
123
下载量
免费
免费
1
收藏
概述
安装方式
版本历史

qwen-qwen3

Qwen — 在本地集群中运行Qwen模型

在您自己的硬件上运行Qwen3.5、Qwen3、Qwen3-Coder和Qwen ASR。集群路由器为每个请求选择最佳设备——聊天、代码生成和语音转文本,统一端点。

支持的Qwen模型

大语言模型(聊天与推理)

模型参数规模Ollama名称最佳用途
Qwen3.50.8B–397B MoEqwen3.5最新——多模态,最强推理
Qwen3
0.6B–235B MoE | qwen3 | 与GPT-4o竞争 | | Qwen2.5 | 0.5B–72B | qwen2.5 | 成熟稳定,多语言 |

代码生成

模型参数规模Ollama名称最佳用途
Qwen3-Coder30B MoE(3.3B激活)qwen3-coder智能体编码工作流
Qwen2.5-Coder
0.5B–32B | qwen2.5-coder | 代码——32B版本匹配GPT-4o |

语音转文本

模型参数规模工具最佳用途
Qwen3-ASR0.6B–1.7Bmlx-qwen3-asr最先进的本地转录

设置

bash
pip install ollama-herd
herd # 启动路由器(端口11435)
herd-node # 在每台机器上运行

拉取Qwen模型

ollama pull qwen3.5:32b ollama pull qwen3-coder

语音转文本:

bash
uv tool install mlx-qwen3-asr[serve] --python 3.14
curl -X POST http://localhost:11435/dashboard/api/settings \
-H Content-Type: application/json -d {transcription: true}

软件包:ollama-herd | 仓库:github.com/geeks-accelerator/ollama-herd

通过集群使用Qwen

OpenAI SDK

python
from openai import OpenAI

client = OpenAI(baseurl=http://localhost:11435/v1, apikey=not-needed)

Qwen3.5用于通用聊天

response = client.chat.completions.create( model=qwen3.5:32b, messages=[{role: user, content: 你好}], stream=True, ) for chunk in response: print(chunk.choices[0].delta.content or , end=)

Qwen3-Coder用于代码

python
response = client.chat.completions.create(
model=qwen3-coder,
messages=[{role: user, content: 用FastAPI和SQLAlchemy写一个CRUD应用}],
)
print(response.choices[0].message.content)

Qwen ASR用于转录

bash
curl http://localhost:11435/api/transcribe -F audio=@meeting.wav

python
import httpx

def transcribe(audio_path):
with open(audio_path, rb) as f:
resp = httpx.post(
http://localhost:11435/api/transcribe,
files={audio: (audio_path, f)},
timeout=300.0,
)
resp.raiseforstatus()
return resp.json()[text]

Ollama API

bash

Qwen3.5聊天


curl http://localhost:11435/api/chat -d {
model: qwen3.5:32b,
messages: [{role: user, content: 解释一下Transformer}],
stream: false
}

Qwen2.5-Coder

curl http://localhost:11435/api/chat -d { model: qwen2.5-coder:32b, messages: [{role: user, content: 优化这个SQL查询:...}], stream: false }

硬件建议

跨平台: 以下为示例配置。任何具有等效内存的设备(Mac、Linux、Windows)均可使用。集群路由器支持所有平台。

模型最低内存推荐硬件
qwen3.5:0.8b2GB任意Mac
qwen3.5:9b
8GB | Mac Mini M4(16GB) | | qwen3.5:32b | 24GB | Mac Mini M4 Pro(48GB) | | qwen3.5:122b-a10b | 64GB | Mac Studio M4 Max(128GB) | | qwen3.5:397b-a17b | 256GB+ | Mac Studio M3 Ultra(512GB) | | qwen3-coder | 24GB | Mac Mini M4 Pro(48GB) | | qwen2.5-coder:32b | 24GB | Mac Mini M4 Pro(48GB) | | Qwen3-ASR(0.6B) | 1.2GB | 任意Mac | | Qwen3-ASR(1.7B) | 3.4GB | 任意Mac(8GB+) |

为什么在本地运行Qwen

  • - 零成本——无需为Qwen API按token付费
  • 隐私——中英文内容保留在您的设备上
  • 完整Qwen家族——聊天、代码、推理和语音转文本,统一集群
  • 无速率限制——阿里云限制API访问。本地运行无限制
  • 集群路由——多台机器分担负载。路由器选择最快可用设备

Qwen在此集群上的优势

Qwen模型特别适合集群路由:

  • - MoE架构——Qwen3.5(总计397B,激活17B)和Qwen3-Coder(总计30B,激活3.3B)使用混合专家模型。每次请求仅激活部分参数,尽管总规模大但速度快。
  • 规模多样性——从0.6B到397B,集群中每台设备都有对应的Qwen模型。小型Mac运行小模型,大型Mac运行大模型。
  • 代码+聊天+语音转文本——Qwen覆盖三种模态。一个供应商,一个集群,三种能力。

此集群还提供

其他大语言模型

Llama 3.3、DeepSeek-V3、DeepSeek-R1、Phi 4、Mistral、Gemma 3——任何Ollama模型都通过同一端点路由。

图像生成

bash
curl -o image.png http://localhost:11435/api/generate-image \
-H Content-Type: application/json \
-d {model:z-image-turbo,prompt:日落,width:1024,height:1024,steps:4}

嵌入

bash
curl http://localhost:11435/api/embeddings -d {model:nomic-embed-text,prompt:查询}

仪表盘

http://localhost:11435/dashboard——监控Qwen请求以及所有其他模型。每个模型的延迟、token吞吐量、错误率、健康检查。

完整文档

智能体设置指南

安全限制

  • - 未经用户确认,绝不拉取或删除Qwen模型。
  • 绝不删除或修改~/.fleet-manager/中的文件。
  • 如果Qwen模型对于可用内存过大,建议使用更小的变体或MoE版本。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 qwen-qwen3-1775928728 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 qwen-qwen3-1775928728 技能

通过命令行安装

skillhub install qwen-qwen3-1775928728

下载

⬇ 下载 qwen-qwen3 v1.0.2(免费)

文件大小: 3.28 KB | 发布时间: 2026-4-12 11:09

v1.0.2 最新 2026-4-12 11:09
Cross-platform support: macOS, Linux, and Windows. Updated OS metadata, descriptions, and hardware recommendations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部