【新手教程】Ollama+Open WebUI 本地部署完整指南：从零搭建私人AI聊天环境

显示全部楼层

前言

想要拥有自己的本地AI聊天环境？不需要昂贵的云服务器，也不需要复杂的配置。本文将手把手教你用Ollama+Open WebUI搭建一套完整的本地AI对话系统，支持多种开源大模型，数据完全私有，适合新手入门。

一、前置条件

操作系统：Windows 10/11、macOS 或 Linux
内存：至少8GB（推荐16GB以上，运行大模型更流畅）
硬盘：至少10GB可用空间
网络：可访问GitHub（下载模型需要）
基础：会打开命令行/终端即可

二、安装Ollama（模型运行引擎）

Ollama是本地运行大语言模型的核心工具，支持Llama、Qwen、DeepSeek等主流开源模型。

步骤1：下载安装

访问 https://ollama.com/download 下载对应系统的安装包，双击安装即可。

Linux用户可直接执行：

curl -fsSL https://ollama.com/install.sh | sh

复制代码

步骤2：验证安装

打开终端，输入：

ollama --version

复制代码

看到版本号即表示安装成功。

步骤3：拉取第一个模型

以阿里通义千问为例（轻量版，适合新手）：

ollama pull qwen2.5:7b

复制代码

等待下载完成（约4-5GB），然后测试：

ollama run qwen2.5:7b

复制代码

看到对话提示符就说明模型可以正常对话了！输入"你好"试试。

三、安装Open WebUI（可视化界面）

Open WebUI为Ollama提供漂亮的Web界面，支持多轮对话、文件上传、历史记录等功能。

步骤1：安装Docker

访问 https://docker.com 下载Docker Desktop并安装。这是最简单的方式。

步骤2：一键启动Open WebUI

打开终端，执行：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

复制代码

步骤3：访问界面

打开浏览器，访问 http://localhost:3000

首次使用需要注册一个本地账号（数据存在你的电脑上，非云端）。

四、配置与使用

1. 选择模型

界面左上角下拉框选择已下载的模型（如qwen2.5:7b），即可开始对话。

2. 下载更多模型

在Ollama官网 https://ollama.com/library 浏览模型库，常用推荐：

qwen2.5:7b - 阿里通义，中文优秀，轻量快速
llama3.2:3b - Meta出品，英文强，体积小巧
deepseek-coder:6.7b - 编程辅助专用
phi4:14b - 微软Phi系列，推理能力强

下载命令示例：

ollama pull llama3.2:3b

复制代码

3. 界面个性化

Open WebUI支持主题切换、对话设置、提示词模板等功能，左侧边栏探索即可。

五、常见问题解决

Q1：下载模型太慢或失败？
A：可配置镜像加速，或使用手机热点下载。部分模型支持断点续传。

Q2：运行时报错"out of memory"？
A：内存不足，请尝试更小的模型（如3b版本），或关闭其他程序释放内存。

Q3：Docker启动失败？
A：确保Docker Desktop已运行，Windows用户需开启WSL2功能。

Q4：如何完全卸载？
A：Ollama直接卸载软件即可；Docker容器执行 docker rm -f open-webui 删除。

Q5：没有显卡能用吗？
A：完全可以！Ollama支持CPU运行，只是速度比GPU慢一些。7B模型在CPU上也能流畅对话。

六、进阶建议