返回顶部
o

ollama-proxyOllama代理

Ollama proxy — one endpoint that routes to multiple Ollama instances. Drop-in Ollama proxy replacement for localhost:11434. Same Ollama API, same model names, but the Ollama proxy routes requests to the best device. Auto-discovers Ollama nodes, scores on 7 signals, retries on failure. Works with Open WebUI, LangChain, Aider. Ollama代理 | proxy Ollama

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.3
安全检测
已通过
146
下载量
免费
免费
3
收藏
概述
安装方式
版本历史

ollama-proxy

Ollama Proxy — 一个端点管理所有Ollama实例

你在多台机器上运行Ollama。无需硬编码IP地址或手动选择要访问的Ollama实例,只需将所有请求指向Ollama Proxy。Ollama Proxy会自动路由到最佳可用设备。

之前: 应用 → http://macmini:11434 (单个Ollama实例,希望它不忙)
之后: 应用 → http://ollama-proxy:11435 (Ollama Proxy自动选择最佳机器)

设置Ollama Proxy

bash
pip install ollama-herd # PyPI: https://pypi.org/project/ollama-herd/

在一台机器上(作为Ollama Proxy):
bash
herd # 在端口11435上启动Ollama Proxy

在每台运行Ollama的机器上:
bash
herd-node # 自动发现网络上的Ollama Proxy

现在将你的应用指向 http://ollama-proxy:11435 而不是 http://localhost:11434。相同的Ollama API、相同的模型名称、相同的流式传输——Ollama Proxy负责更智能的路由。

即插即用的Ollama Proxy替代方案

所有Ollama API端点均可通过Ollama Proxy工作:

bash

通过Ollama Proxy聊天(与直接使用Ollama相同)


curl http://ollama-proxy:11435/api/chat -d {
model: llama3.3:70b,
messages: [{role: user, content: 通过Ollama Proxy问好}]
}

通过Ollama Proxy生成(与直接使用Ollama相同)

curl http://ollama-proxy:11435/api/generate -d { model: qwen3:32b, prompt: 通过Ollama Proxy解释量子计算 }

通过Ollama Proxy列出模型(汇总所有Ollama节点)

curl http://ollama-proxy:11435/api/tags

通过Ollama Proxy列出已加载模型(跨所有Ollama节点)

curl http://ollama-proxy:11435/api/ps

通过Ollama Proxy拉取模型(自动选择最佳节点)

curl -N http://ollama-proxy:11435/api/pull -d {name: codestral}

兼容OpenAI的Ollama Proxy API

Ollama Proxy还暴露了兼容OpenAI的端点——相同的模型,无需修改代码:

python
from openai import OpenAI

指向Ollama Proxy而非直接使用Ollama

ollamaproxyclient = OpenAI(baseurl=http://ollama-proxy:11435/v1, apikey=not-needed) ollamaproxyresponse = ollamaproxyclient.chat.completions.create( model=llama3.3:70b, messages=[{role: user, content: 通过Ollama Proxy问好}], stream=True, )

Ollama Proxy相比直接使用Ollama的额外功能

功能直接使用OllamaOllama Proxy (Herd)
多机器支持手动切换IPOllama Proxy自动路由
负载均衡
无 | Ollama Proxy基于7个信号评分 | | 故障转移 | 无 | Ollama Proxy自动重试下一个节点 | | 模型发现 | 每台机器独立 | Ollama Proxy汇总整个集群 | | 队列管理 | 无 | Ollama Proxy管理每节点:模型队列 | | 仪表盘 | 无 | Ollama Proxy提供实时Web界面 | | 健康检查 | 无 | Ollama Proxy运行15项自动检查 | | 请求追踪 | 无 | Ollama Proxy记录到SQLite追踪存储 | | 图像生成 | 无 | Ollama Proxy路由mflux + DiffusionKit | | 语音转文字 | 无 | Ollama Proxy路由Qwen3-ASR |

Ollama Proxy与现有工具兼容

只需将Ollama URL改为Ollama Proxy——无需其他配置:

工具之前(直接使用Ollama)之后(使用Ollama Proxy)
Open WebUIhttp://localhost:11434http://ollama-proxy:11435
Aider
--openai-api-base http://localhost:11434/v1 | --openai-api-base http://ollama-proxy:11435/v1 |
| Continue.dev | 本地Ollama | 使用ollama-proxy:11435的Ollama Proxy |
| LangChain | Ollama(baseurl=http://localhost:11434) | Ollama(baseurl=http://ollama-proxy:11435) |
| LiteLLM | ollama/llama3.3:70b | ollama/llama3.3:70b(指向Ollama Proxy) |
| CrewAI | OPENAIAPIBASE=http://localhost:11434/v1 | OPENAIAPIBASE=http://ollama-proxy:11435/v1 |

Ollama Proxy如何路由请求

当请求到达Ollama Proxy时,它会对所有拥有请求模型的Ollama节点进行评分:

  1. 1. 热状态 — 模型是否已加载到Ollama实例中(热加载)?
  2. 内存适配 — Ollama节点是否有足够的空闲RAM?
  3. 队列深度 — Ollama节点是否忙于处理其他请求?
  4. 延迟历史 — 该Ollama节点最近响应速度如何?
  5. 角色亲和性 — Ollama Proxy将大模型发送到大机器
  6. 可用性趋势 — 该Ollama节点是否稳定可用?
  7. 上下文适配 — 已加载的上下文窗口是否匹配请求?

得分最高的Ollama节点胜出。如果失败,Ollama Proxy会自动重试下一个最佳节点。

监控你的Ollama Proxy集群

Ollama Proxy仪表盘位于 http://ollama-proxy:11435/dashboard —— 实时查看每个Ollama节点、每个模型、每个队列。

bash

Ollama Proxy集群概览


curl -s http://ollama-proxy:11435/fleet/status | python3 -m json.tool

Ollama Proxy健康检查

curl -s http://ollama-proxy:11435/dashboard/api/health | python3 -m json.tool

完整文档

贡献

Ollama Herd(Ollama Proxy)是开源的(MIT协议)。我们欢迎贡献:

  • - 在GitHub上星标 — 帮助他人找到Ollama Proxy
  • 提交问题 — 错误报告、功能请求
  • 欢迎PR — CLAUDE.md为AI代理提供完整的Ollama Proxy上下文。444个测试,异步Python。

安全护栏

  • - 不自动下载模型 — Ollama Proxy需要用户明确确认才能拉取模型。
  • 删除模型需要通过Ollama Proxy进行用户明确确认。
  • 所有Ollama Proxy请求保持本地 — 没有数据离开你的网络。
  • 切勿删除或修改 ~/.fleet-manager/ 中的文件。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ollama-proxy-1775910723 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ollama-proxy-1775910723 技能

通过命令行安装

skillhub install ollama-proxy-1775910723

下载

⬇ 下载 ollama-proxy v1.0.3(免费)

文件大小: 3.17 KB | 发布时间: 2026-4-12 10:46

v1.0.3 最新 2026-4-12 10:46
Added /api/pull to drop-in compatibility examples

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部