返回顶部
o

ollama-skillOllama集成技能

Use when user wants to integrate Ollama into coding agents, IDEs, or agent harnesses. Supports local/on-prem/Docker deployment, Ollama Cloud, OpenAI/Anthropic-compatible endpoints, streaming, structured outputs, embeddings, tool calling, and web search.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
114
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

ollama-skill

技能名称: ollama-skill
详细描述:
以最少的代码更改将Ollama集成到编码代理、IDE和代理框架中。支持本地/本地部署/Docker部署、Ollama Cloud以及兼容OpenAI/Anthropic的端点。提供流式传输、结构化输出、嵌入、工具调用和网络搜索功能,并支持与提供商无关的模型路由。

字段
标识符ollama-skill
版本
1.0.0 |
| 作者 | Wai Yan Nyein Naing |
| 分类 | ai-ml |
| 安装次数 | 0 |
| 评分 | 0 / 5 (0 个评分) |
| 许可证 | MIT |

GitHub: WaiYanNyeinNaing/ollama-skill — ⭐ 0 | Forks: 0



技能概述

Ollama Runtime 帮助 AI 编码代理以最少的代码更改将 Ollama 集成到应用程序、编码助手、IDE 插件和代理框架中。它提供优先API的集成,具有与提供商无关的兼容性、框架安全的默认设置、最小的可逆补丁以及清晰的本地与云端切换。

此技能专注于运行时/推理集成,而非模型训练内部机制。

何时使用此技能

  • - 在本地、本地部署、Docker 中或通过 Ollama Cloud 运行 Ollama
  • 将编码代理或应用程序后端连接到 Ollama API
  • 在代理框架中支持与提供商无关的模型路由
  • 使用流式传输、结构化输出、嵌入、工具调用或网络搜索
  • 针对兼容 Ollama 的端点重用现有的 OpenAI 或 Anthropic SDK
  • 为 Ollama 支持的编码工具和 IDE 配置集成

何时不使用此技能

  • - 深度微调工作流,除非任务仅涉及运行时消耗
  • 仅进行基准测试而无集成工作
  • 与 API 或代理设置无关的桌面 UI 演示
  • 当前文档中未包含的推测性 API 参数

核心能力

  • - 基础聊天 通过 /api/chat 用于副驾驶、应用助手和迭代代理循环
  • 流式传输 用于聊天界面、终端、编码副驾驶和长文本生成
  • 思考 支持输出推理轨迹的模型
  • 结构化输出 用于代理阶段之间机器可读的 JSON
  • 嵌入 用于语义搜索、检索、RAG 和最近邻查找
  • 工具调用 用于有界的外部函数调用
  • 网络搜索 用于需要最新外部信息的答案

支持的集成目标

  • - 助手:OpenClaw 及类似助手
  • 编码代理:Claude Code、Codex、OpenCode、Droid、Goose、Pi
  • IDE/编辑器:VS Code、JetBrains、Roo Code、Xcode、Zed、Cline
  • 应用程序后端和内部代理框架
  • 相关的 MCP 启用工具生态系统

安装后

  1. 1. 阅读安装目录中的 SKILL.md
  2. 按照其说明完成用户的任务
  3. 返回并评分/评论该技能(见下文)

核心事实

部署方式API 基础 URL需要认证
本地http://localhost:11434/api
Docker
http://localhost:11434/api | 否 | | 直接云端 | https://ollama.com/api | 是 (API 密钥) |
  • - 兼容 OpenAI 的客户端:http://localhost:11434/v1/
  • 兼容 Anthropic 的客户端:http://localhost:11434
  • 对于某些端点,REST API 流式传输默认启用
  • 除非设置 stream=True / stream: true,否则 SDK 流式传输默认禁用

快速开始

1. 设置环境变量

bash

本地 / 本地部署 / Docker


export OLLAMA_HOST=http://localhost:11434
export OLLAMAAPIBASE=http://localhost:11434/api
export OLLAMA_MODEL=qwen3-coder
export OLLAMAEMBEDMODEL=embeddinggemma

直接云端 API (可选)

export OLLAMAAPIKEY=yourapikey

2. 基础聊天示例 (Python)

python
import requests
import os

OLLAMAAPIBASE = os.getenv(OLLAMAAPIBASE, http://localhost:11434/api)
MODEL = os.getenv(OLLAMA_MODEL, qwen3-coder)

response = requests.post(
f{OLLAMAAPIBASE}/chat,
json={
model: MODEL,
messages: [{role: user, content: Hello!}],
stream: False
}
)
print(response.json()[message][content])

3. 运行示例

bash

克隆并设置


git clone https://github.com/WaiYanNyeinNaing/ollama-skill.git
cd ollama-skill
cp .env.example .env
pip install -r requirements.txt

运行示例

python examples/pythonnativechat.py

实施指南

决策策略

选择本地/本地部署当:

  • - 数据必须保留在设备或内部网络中
  • 编码代理与模型主机位于同一位置
  • 低延迟工具使用很重要
  • 用户已有 Ollama 或 Docker 可用

选择云端当:

  • - 本地硬件不足
  • 用户希望快速使用更大的模型
  • 可以接受托管推理
  • 应用程序需要远程 Ollama 主机

选择兼容模式当:

  • - 代码库已使用 OpenAI SDK 模式
  • 代码库已使用 Anthropic SDK 模式
  • 用户希望迁移成本最小化

实施工作流

将 Ollama 集成到应用程序或编码代理时,请按以下顺序操作:

  1. 1. 确定部署模式:本地、本地+云端模型或直接云端 API
  2. 通过环境变量添加配置表面
  3. 首先实现一个基础聊天路径
  4. 明确选择流式传输与非流式传输
  5. 如果需要下游解析,添加结构化输出
  6. 如果需要操作,添加工具调用
  7. 如果需要检索,添加嵌入
  8. 仅在信息新鲜度重要时添加网络搜索
  9. 仅在能降低迁移成本时使用兼容模式
  10. 清晰记录切换规则

能力详情

基础聊天

使用 /api/chat 进行聊天式交互和编码代理。

python
import requests

response = requests.post(
http://localhost:11434/api/chat,
json={
model: qwen3-coder,
messages: [
{role: system, content: 你是一个有用的编码助手。},
{role: user, content: 写一个反转字符串的 Python 函数。}
],
stream: False
}
)
result = response.json()
print(result[message][content])

流式传输

对聊天界面、终端、编码副驾驶和长文本生成使用流式传输。

python
import requests

response = requests.post(
http://localhost:11434/api/chat,
json={
model: qwen3-coder,
messages: [{role: user, content: 写一个长故事...}],
stream: True
},
stream=True
)

for line in response.iter_lines():
if line:
chunk = line.decode(utf-8)
# 解析 NDJSON 块

规则:

  • - REST API 响应可能会流式传输 NDJSON
  • SDK 需要显式启用流式传输
  • 流式传输的块可能包含 content、thinking 或 tool_calls

结构化输出

当下一个系统组件需要机器可读的 JSON 时,使用结构化输出。

python
import requests

schema = {
type: object,
properties: {
function_name: {type: string},
parameters: {type: array, items: {type: string}},
return_type: {type: string}
},
required: [functionname, parameters, returntype]
}

response = requests.post(
http://localhost:11434/api/chat,
json={
model: qwen3-coder,
messages: [{role: user, content: 分析这个函数...}],
stream: False,
format: schema
}
)

规则:

  • - 优先使用 stream: false
  • 对于普通 JSON 使用 format: json
  • 当形状重要时,在

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 ollama-skill-1775730307 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 ollama-skill-1775730307 技能

通过命令行安装

skillhub install ollama-skill-1775730307

下载

⬇ 下载 ollama-skill v1.0.0(免费)

文件大小: 11.55 KB | 发布时间: 2026-4-11 22:58

v1.0.0 最新 2026-4-11 22:58
Ollama Skill 1.0.0 – Initial Release

- Enables seamless integration of Ollama with coding agents, IDEs, and agent harnesses.
- Supports local, on-prem, Docker, and Ollama Cloud deployment.
- Provides API-first integration, OpenAI/Anthropic compatibility, streaming, structured outputs, embeddings, tool calling, and web search.
- Includes example workflows, environment variable setup, and quickstart guides.
- Offers provider-agnostic model routing for minimal integration changes across runtimes.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部