返回顶部
s

self-hosted-ai自托管AI平台

Self-hosted AI — run your own LLM inference, image generation, speech-to-text, and embeddings. No cloud APIs, no SaaS subscriptions, no data leaving your network. Self-hosted alternative to OpenAI, DALL-E, Whisper API, and cloud embedding services. Route across macOS, Linux, and Windows machines. 自托管AI本地推理平台。IA autoalojada sin dependencias en la nube.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.2
安全检测
已通过
125
下载量
免费
免费
2
收藏
概述
安装方式
版本历史

self-hosted-ai

自托管AI — 拥有你的完整AI栈

停止按token付费。停止向云端API发送数据。在你的自有硬件上运行自托管LLM、自托管图像生成、自托管语音转文本和自托管嵌入。一个自托管路由器让你的所有设备如同一个系统般协同工作。

自托管AI替代方案

云服务自托管替代方案实现方式
OpenAI API通过Ollama自托管Llama 3.3、Qwen 3.5、DeepSeek-R1相同OpenAI SDK,更换基础URL
DALL-E / Midjourney
通过mflux/DiffusionKit自托管Stable Diffusion 3、Flux | POST /api/generate-image | | Whisper API | 通过MLX自托管Qwen3-ASR | POST /api/transcribe | | OpenAI Embeddings | 通过Ollama自托管nomic-embed-text、mxbai-embed | POST /api/embed |

相同API。相同质量。零按次请求成本。所有数据保留在你的自托管机器上。

自托管设置

bash
pip install ollama-herd # 从PyPI安装自托管AI路由器
herd # 启动自托管路由器
herd-node # 在每台自托管机器上运行 — 自动发现路由器

无需Docker。无需Kubernetes。无需配置文件。自托管设备在本地网络上自动相互发现。

自托管LLM推理

OpenAI SDK的直接自托管替代方案:

python
from openai import OpenAI

自托管推理客户端 — 替代OpenAI云端

selfhostedclient = OpenAI(baseurl=http://localhost:11435/v1, apikey=not-needed)

selfhostedresponse = selfhostedclient.chat.completions.create(
model=llama3.3:70b, # 自托管模型,无云端依赖
messages=[{role: user, content: 分析这份合同的风险}],
stream=True,
)
for chunk in selfhostedresponse:
print(chunk.choices[0].delta.content or , end=)

自托管Ollama API

bash
curl http://localhost:11435/api/chat -d {
model: deepseek-r1:70b,
messages: [{role: user, content: 解释自托管AI相比云端API的优势}],
stream: false
}

自托管图像生成

DALL-E和Midjourney的自托管替代方案:

bash

在任何节点上安装自托管图像后端


uv tool install mflux # 自托管Flux模型(约7秒)
uv tool install diffusionkit # 自托管Stable Diffusion 3/3.5

在你的自托管集群上生成图像

curl -o selfhostedoutput.png http://localhost:11435/api/generate-image \ -H Content-Type: application/json \ -d {model: z-image-turbo, prompt: 自托管AI生成产品模型, width: 1024, height: 1024}

自托管语音转文本

Whisper API的自托管替代方案:

bash
curl http://localhost:11435/api/transcribe \
-F file=@selfhostedmeeting.wav \
-F model=qwen3-asr

所有自托管转录保留在你的网络中。无音频数据发送到云端服务。

自托管嵌入

OpenAI嵌入API的自托管替代方案:

bash
curl http://localhost:11435/api/embed \
-d {model: nomic-embed-text, input: 用于私有RAG管道的自托管文档嵌入}

自托管成本对比

服务云端成本自托管成本
GPT-4o(每月100万token)约15-30美元/月0美元(你拥有的自托管硬件)
DALL-E(每月1000张图像)
约40美元/月 | 0美元(自托管图像生成) | | Whisper API(每月10小时音频) | 约6美元/月 | 0美元(自托管转录) | | OpenAI嵌入(每月100万token) | 约0.10美元/月 | 0美元(自托管嵌入) | | 总计 | 约60+美元/月 | 自托管每月0美元 |

硬件投资后,每个自托管请求永久免费。无速率限制,无使用上限,无意外账单。

自托管优势

  • - 自托管数据主权 — 提示词、图像、音频和文档永不离开你的网络
  • 自托管吞吐量 — 你的硬件,无速率限制
  • 自托管正常运行时间 — 云端API中断不影响你的自托管集群
  • 自托管灵活性 — 即时切换模型,无供应商锁定
  • 自托管合规性 — HIPAA、GDPR、SOC2 — 无第三方数据处理者
  • 自托管可预测性 — 硬件折旧,但永不给你意外账单

自托管集群路由

自托管路由器根据7个信号对每台设备评分,并为每个请求选择最佳设备。多台自托管机器自动分担负载。

bash

自托管集群概览


curl -s http://localhost:11435/fleet/status | python3 -m json.tool

自托管健康检查

curl -s http://localhost:11435/dashboard/api/health | python3 -m json.tool

针对你硬件的自托管模型推荐

curl -s http://localhost:11435/dashboard/api/recommendations | python3 -m json.tool

自托管仪表板位于 http://localhost:11435/dashboard,用于可视化监控你的整个自托管集群。

完整自托管文档

贡献

Ollama Herd是开源项目(MIT)。为所有人提供自托管AI:

  • - 在GitHub上标星 — 帮助他人发现自托管AI
  • 提交Issue — 分享你的自托管设置
  • 欢迎PR,来自人类和AI Agent。CLAUDE.md提供完整的自托管上下文。444个测试。

自托管安全护栏

  • - 无自动下载 — 所有自托管模型拉取都需要明确的用户确认。
  • 自托管模型删除需要明确的用户确认。
  • 所有自托管请求保持本地 — 无数据离开你的网络。无遥测,无分析,无云端回调。
  • 切勿删除或修改 ~/.fleet-manager/ 中的自托管文件。
  • 你的自托管集群零云端依赖 — 初始模型下载后可完全离线工作。

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 self-hosted-ai-1775910676 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 self-hosted-ai-1775910676 技能

通过命令行安装

skillhub install self-hosted-ai-1775910676

下载

⬇ 下载 self-hosted-ai v1.0.2(免费)

文件大小: 3.42 KB | 发布时间: 2026-4-12 11:19

v1.0.2 最新 2026-4-12 11:19
Cross-platform support: macOS, Linux, and Windows. Updated OS metadata, descriptions, and hardware recommendations.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部