闲社

标题: 【新手教程】Ollama 本地部署大模型完全指南:从零搭建你的私有 AI 环境 [打印本页]

作者: dcs2000365    时间: 3 小时前
标题: 【新手教程】Ollama 本地部署大模型完全指南:从零搭建你的私有 AI 环境
【新手教程】Ollama 本地部署大模型完全指南:从零搭建你的私有 AI 环境

为什么本地部署?

最近 AI 圈有个趋势越来越明显:大家不再只依赖云端 API,而是开始在自己的电脑/服务器上跑大模型。本地部署的好处很实在:


今天这篇教程,手把手教你用 Ollama 这个神器,在本地快速跑起各种开源大模型。

一、前置条件

1. 硬件要求


2. 系统要求


二、安装 Ollama

macOS / Linux — 一键安装

打开终端,复制粘贴这条命令:
  1. curl -fsSL https://ollama.com/install.sh | sh
复制代码

等待几分钟,Ollama 会自动下载安装。装完后验证一下:
  1. ollama --version
复制代码
看到版本号就说明装好了。

Windows — 安装包方式



三、拉取并运行你的第一个模型

Ollama 的模型库非常丰富,从 Llama 到 Qwen 到 DeepSeek 都有。我们以 Llama 3.1 8B 为例:
  1. ollama pull llama3.1:8b
复制代码

下载大概 4.7GB,视网速可能需要几分钟到十几分钟。下载完成后直接对话:
  1. ollama run llama3.1:8b
复制代码

看到提示符后就可以输入问题了,比如:
  1. 你好,请介绍一下你自己
复制代码

Ctrl+D 或输入 /bye 退出对话。

四、常用模型推荐

根据你的硬件配置选择:

轻量级(8GB 内存)


中等配置(16GB 内存)


高配玩家(32GB+ 内存 / 高端显卡)


五、进阶玩法

1. 使用 API 调用

Ollama 默认开启本地 API 服务(端口 11434),你可以用 curl 或任何 HTTP 客户端调用:
  1. curl http://localhost:11434/api/generate -d '{
  2.   "model": "llama3.1:8b",
  3.   "prompt": "写一首关于夏天的诗"
  4. }'
复制代码

2. 搭配 Web UI 使用

命令行对话毕竟不够友好,推荐几个图形界面:


安装 Open WebUI 最简单的方式是用 Docker:
  1. docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
复制代码

然后浏览器访问 http://localhost:3000 就能用了。

3. 自定义系统提示词

创建你自己的模型变体:
  1. ollama create my-assistant -f Modelfile
复制代码

Modelfile 内容示例:
  1. FROM llama3.1:8b
  2. SYSTEM 你是一个专业的编程助手,擅长 Python 和 JavaScript。回答要简洁,直接给出代码示例。
复制代码

六、常见问题与解决

Q1:下载模型特别慢怎么办?
A:Ollama 默认从官方仓库下载,国内用户可以用镜像加速。或者手动下载模型文件后放到 ~/.ollama/models 目录。

Q2:CPU 跑模型很卡,怎么优化?
A:


Q3:Windows 上安装失败?
A:


Q4:怎么查看已安装的模型?
A:
  1. ollama list
复制代码

Q5:怎么删除不需要的模型?
A:
  1. ollama rm llama3.1:8b
复制代码

七、总结

Ollama 把本地部署大模型的门槛降到了最低。以前需要折腾 CUDA、PyTorch、各种依赖,现在一条命令就能搞定。对于新手来说,这是入坑本地 AI 最好的起点。

下一步建议:


有问题欢迎在楼下留言,我会尽量回复。也欢迎大家分享自己的部署经验和踩坑记录!

---
本教程基于 Ollama 最新版本编写,如有更新请以官方文档为准。




欢迎光临 闲社 (https://www.xianshe.com/) Powered by Discuz! X5.0