支持的 LLM Providers
goose 兼容很多 LLM Providers,你可以按自己的成本、模型偏好、部署方式和安全要求来选择。
goose 很依赖 tool calling。优先选择在函数调用、长上下文和多轮任务里表现稳定的模型。
Berkeley Function-Calling Leaderboard 也可以作为选型参考。
可用 Providers
| Provider | 说明 | 主要参数 |
|---|---|---|
| Amazon Bedrock | 提供 Claude、Jurassic-2 等多种基础模型。AWS 环境变量需要提前配置,不能完全通过 goose configure 完成。 | 凭证认证:AWS_PROFILE,或 AWS_ACCESS_KEY_ID、AWS_SECRET_ACCESS_KEY、AWS_REGIONBearer Token 认证: AWS_BEARER_TOKEN_BEDROCK 与 AWS_REGION、AWS_DEFAULT_REGION 或 AWS_PROFILE |
| Amazon SageMaker TGI | 通过 SageMaker endpoint 运行 Text Generation Inference 模型。AWS 凭证需要预先配置。 | SAGEMAKER_ENDPOINT_NAME,AWS_REGION(可选),AWS_PROFILE(可选) |
| Anthropic | 使用 Claude 等模型。 | ANTHROPIC_API_KEY,ANTHROPIC_HOST(可选) |
| Avian | 面向 DeepSeek、Kimi、GLM、MiniMax 等模型的低成本推理 API,兼容 OpenAI 风格接口。 | AVIAN_API_KEY,AVIAN_HOST(可选) |
| Azure OpenAI | 使用托管在 Azure 上的 OpenAI 模型,支持 API Key 和 Azure Credential Chain。 | AZURE_OPENAI_ENDPOINT,AZURE_OPENAI_DEPLOYMENT_NAME,AZURE_OPENAI_API_KEY(可选) |
| ChatGPT Codex | 接入面向代码生成与理解优化的 GPT-5 Codex 模型。需要 ChatGPT Plus / Pro 订阅。 | 无需手工 API Key。CLI 和 Desktop 都通过浏览器 OAuth 完成认证。 |
| Databricks | 数据与 AI 一体平台,可统一托管并调用模型。 | DATABRICKS_HOST,DATABRICKS_TOKEN |
| Docker Model Runner | 在 Docker Desktop 或 Docker CE 中运行本地模型,并通过 OpenAI 兼容接口接入。因为是本地模型,需要先拉模型。 | OPENAI_HOST,OPENAI_BASE_PATH |
| Gemini | Google 的多模态模型。Gemini 3 支持可配置的 thinking level。 | GOOGLE_API_KEY,GEMINI3_THINKING_LEVEL(可选) |
| GCP Vertex AI | 通过 Google Cloud Vertex AI 使用 Gemini、Claude 等模型。认证需要提前按 Google Cloud 要求配置。 | GCP_PROJECT_ID,GCP_LOCATION,以及可选的重试参数:GCP_MAX_RATE_LIMIT_RETRIES、GCP_MAX_OVERLOADED_RETRIES、GCP_INITIAL_RETRY_INTERVAL_MS、GCP_BACKOFF_MULTIPLIER、GCP_MAX_RETRY_INTERVAL_MS |
| GitHub Copilot | 通过 GitHub Copilot 基础设施访问 OpenAI、Anthropic、Google 等模型。需要有 Copilot 权限的 GitHub 账号。 | 无需手工 API Key。CLI 和 Desktop 都使用 device flow 认证。 |
| Groq | 高性能推理硬件与模型服务。 | GROQ_API_KEY |
| LiteLLM | 多模型代理层,统一 API,支持 prompt caching 和多后端代理。 | LITELLM_HOST,LITELLM_BASE_PATH(可选),LITELLM_API_KEY(可选),LITELLM_CUSTOM_HEADERS(可选),LITELLM_TIMEOUT(可选) |
| LM Studio | 通过 LM Studio 提供的 OpenAI 兼容本地服务运行模型。先下载模型。 | 通常无需额外参数,默认连接 localhost:1234 |
| Mistral AI | 提供通用模型、代码模型(Codestral)和多模态模型(Pixtral)。 | MISTRAL_API_KEY |
| Ollama | 本地模型运行器,支持 Qwen、Llama、DeepSeek 等开源模型。先下载并启动模型。 | OLLAMA_HOST |
| OpenAI | 使用 GPT-4o、o 系列等模型,也可接入 OpenAI 兼容 endpoint。o1-mini 和 o1-preview 不支持,因为 goose 依赖 tool calling。 | OPENAI_API_KEY,OPENAI_HOST(可选),OPENAI_ORGANIZATION(可选),OPENAI_PROJECT(可选),OPENAI_CUSTOM_HEADERS(可选) |
| OpenRouter | 聚合多个模型供应商,便于统一调用与限流。 | OPENROUTER_API_KEY |
| OVHcloud AI | 通过 AI Endpoints 访问 Qwen、Llama、Mistral、DeepSeek 等开源模型。 | OVHCLOUD_API_KEY |
| Ramalama | 基于 OCI 容器运行时的本地模型运行器,可通过 goose 的 Ollama provider 兼容接入。先下载并运行模型。 | OLLAMA_HOST |
| Snowflake | 通过 Snowflake Cortex 使用最新模型,包括 Claude。需要 Snowflake 账号和 PAT。 | SNOWFLAKE_HOST,SNOWFLAKE_TOKEN |
| Tanzu AI Services | 通过 VMware Tanzu 平台统一访问企业管理的 LLM。模型从 endpoint 动态获取。 | TANZU_AI_API_KEY,TANZU_AI_ENDPOINT |
| Tetrate Agent Router Service | 统一 AI 网关,可接入 Claude、Gemini、GPT 和开源模型,支持 PKCE 流程。 | TETRATE_API_KEY,TETRATE_HOST(可选) |
| Venice AI | 提供以隐私为重点的开源模型访问能力,如 Llama、Mistral、Qwen。 | VENICE_API_KEY,VENICE_HOST(可选),VENICE_BASE_PATH(可选),VENICE_MODELS_PATH(可选) |
| xAI | 使用 xAI 的 Grok 系列模型。 | XAI_API_KEY,XAI_HOST(可选) |
通过 Anthropic、Databricks、OpenRouter、LiteLLM 使用 Claude 模型时,goose 会自动启用 Anthropic 的 prompt caching。这会在请求中加入 cache_control 标记,能降低长会话的成本。实现细节可参考 provider implementations。
CLI Providers
goose 还支持一类特殊的“透传式” CLI providers。它们直接复用你已有的 CLI 工具和订阅,而不是单独按 token 付费。
| Provider | 说明 | 要求 |
|---|---|---|
Claude Code (claude-code) | 使用 Anthropic 的 Claude CLI 工具,并复用你的 Claude Code 订阅。上下文窗口可到 200K。 | 已安装并登录 Claude CLI,且有有效 Claude Code 订阅 |
OpenAI Codex (codex) | 使用 OpenAI Codex CLI,并复用 ChatGPT Plus / Pro 订阅。 | 已安装并登录 Codex CLI,且有有效 ChatGPT Plus / Pro 订阅 |
Cursor Agent (cursor-agent) | 使用 Cursor 的 CLI 工具,接入 GPT-5、Claude 4 等模型。 | 已安装并登录 cursor-agent |
Gemini CLI (gemini-cli) | 使用 Google Gemini CLI 工具,并复用 Google AI 订阅。 | 已安装并登录 Gemini CLI |
CLI provider 的成本通常更可控,因为它们复用你现有订阅;但工作方式和 API provider 不同,本质上是执行 CLI 命令并接入工具原生能力。详细配置见 CLI Providers 指南。
ACP Providers
goose 支持把 Agent Client Protocol (ACP) agent 当作 provider 使用。ACP provider 会把 goose 扩展透传给对应 agent,作为 MCP server 暴露出去。
| Provider | 说明 | 要求 |
|---|---|---|
Claude ACP (claude-acp) | 通过 ACP 使用 Claude Code,同时把 goose 扩展透传给 agent。 | npm install -g @zed-industries/claude-agent-acp,有效 Claude Code 订阅 |
Codex ACP (codex-acp) | 通过 ACP 使用 OpenAI Codex,并把 goose 扩展透传给 agent。 | npm install -g @zed-industries/codex-acp,有效 ChatGPT Plus / Pro 订阅 |
详细接入方式见 ACP Providers 指南。
配置 Provider 和模型
无论你选择哪一种 provider,都可以在 goose Desktop 的 Models 标签页里操作,或者在 CLI 里执行 goose configure。
- goose Desktop
- goose CLI
首次配置
第一次打开 goose Desktop 时,你通常会看到这些入口:
- Quick Setup with API Key - goose 会根据你的 API Key 自动识别并配置 Provider。
- ChatGPT Subscription - 使用 ChatGPT Plus / Pro 订阅登录,访问 GPT-5 Codex 模型。
- Agent Router by Tetrate - 通过自动配置快速接入多个 AI 模型。
- OpenRouter - 通过单一 API 使用多个模型,按量付费。
- Other Providers - 在设置里手动配置其它 Provider。
- Quick Setup
- ChatGPT Subscription
- Agent Router
- OpenRouter
- Other Providers
- 选择
Quick Setup with API Key - 输入你的 API Key(例如 OpenAI、Anthropic 或 Google)
- goose 会自动识别并配置对应 Provider
- 配置完成后即可开始第一个会话
- 选择
ChatGPT Subscription - goose 会打开浏览器,让你用有效的 ChatGPT Plus / Pro 订阅账号登录
- 授权 goose 访问这个订阅
- 返回 goose Desktop 后即可开始使用
对新用户来说,Agent Router by Tetrate 是一个很好的起点,因为它可以用内置限流和自动 failover 提供多个模型。
第一次通过 goose 自动完成 Tetrate 认证时,你会拿到 10 美元免费额度。新老 Tetrate 用户都适用。
- 选择
Agent Router by Tetrate - goose 会打开浏览器,让你登录或创建 Tetrate 账号
- 返回 goose Desktop 后即可开始使用
- 选择
Automatic setup with OpenRouter - goose 会打开浏览器,让你登录或创建 OpenRouter 账号
- 返回 goose Desktop 后即可开始使用
- 如果你已经有想用的 Provider 和对应 API Key,选择
Other Providers - 在列表里找到目标 Provider 并点击
Configure - 如果列表里没有,点击底部的
Add Custom Provider来配置自定义 Provider - 按要求输入 API Key、Host 或其它参数,然后点击
Submit
对 Ollama 来说,所有本地已安装模型都会自动出现在模型选择下拉里。
更新 Provider 和 API Key
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 选择你的 Provider
- 填写 API Key 和其它必需参数,然后点击
Submit
切换当前模型
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Switch models - 从已配置 Provider 中选择,或选择
Use other provider新增 Provider - 从列表中选模型,或者使用
Use custom model直接输入模型名 - 点击
Select model
你也可以点击应用底部当前模型名称,然后选择 Change Model。
重置 Provider 和模型配置
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Reset Provider and Model
-
在终端运行:
goose configure -
选择
Configure Providers┌ goose-configure
│
◆ What would you like to configure?
│ ● Configure Providers (Change provider or update credentials)
│ ○ Custom Providers
│ ○ Add Extension
│ ○ Toggle Extensions
│ ○ Remove Extension
│ ○ goose Settings
└ -
选择目标 model provider。可以用方向键移动,也可以直接输入关键词过滤。
┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Amazon Bedrock
│ ○ Amazon SageMaker TGI
│ ● Anthropic (Claude and other models from Anthropic)
│ ○ Azure OpenAI
│ ○ Claude Code CLI
└ -
按提示输入 API Key 及其它配置。
┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Anthropic
│
◆ Provider Anthropic requires ANTHROPIC_API_KEY, please enter a value
│ ▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪
└如果你只是切换模型,可以跳过无需更新的配置项。
-
输入
ANTHROPIC_HOST,或者直接按Enter使用默认值。◆ Provider Anthropic requires ANTHROPIC_HOST, please enter a value
│ https://api.anthropic.com (default) -
选择你要使用的模型。根据 Provider 不同,可能是:
- 从列表中选择
- 输入名称搜索
- 直接手动输入模型名
│
◇ Model fetch complete
│
◇ Select a model:
│ claude-sonnet-4-5 (default)
│
◒ Checking your configuration...
└ Configuration saved successfully
goose configure 本身不支持直接输入任意自定义模型名。如果目标模型不在列表里,可以改用 goose Desktop,或者直接编辑 config.yaml 中的 GOOSE_MODEL。
如果只想对单个会话临时切换模型,也可以直接使用 run 命令 传入对应参数。
使用自定义 OpenAI Endpoints
内置 OpenAI provider 不只支持 OpenAI 官方 API(api.openai.com),也能接入任何兼容 OpenAI 协议的 endpoint,例如:
- 通过 vLLM、KServe 暴露的自托管模型
- 企业内部的 OpenAI 兼容 API 服务
- 出于数据治理、安全审计或私有部署要求而搭建的代理层
- 像 LiteLLM、Docker Model Runner 这样的统一网关或本地运行器
如果你需要同时连接多个 OpenAI 兼容 endpoint,或者想给它们起更清晰的显示名,通常更适合继续往下看 配置自定义 Provider。
配置参数
| 参数 | 必填 | 说明 |
|---|---|---|
OPENAI_API_KEY | 是 | 用于认证的 API Key。某些本地服务虽然不校验,但很多代理层仍要求填写一个值 |
OPENAI_HOST | 否 | 自定义 endpoint 地址;留空时默认走 api.openai.com |
OPENAI_ORGANIZATION | 否 | 用于 OpenAI 组织级使用追踪与治理 |
OPENAI_PROJECT | 否 | 用于项目级资源管理与审计 |
OPENAI_CUSTOM_HEADERS | 否 | 附加请求头。可通过环境变量、配置文件或 CLI 传入,格式如 HEADER_A=VALUE_A,HEADER_B=VALUE_B |
配置示例
- vLLM 自托管
- KServe 部署
- 企业 OpenAI 网关
- 自定义请求头
如果你使用 vLLM 暴露 LLaMA、Mistral 等模型,可按这种方式接入:
OPENAI_HOST=https://your-vllm-endpoint.internal
OPENAI_API_KEY=your-internal-api-key
对部署在 Kubernetes / KServe 上的模型,可以这样配置:
OPENAI_HOST=https://kserve-gateway.your-cluster
OPENAI_API_KEY=your-kserve-api-key
OPENAI_ORGANIZATION=your-org-id
OPENAI_PROJECT=ml-serving
如果你的企业环境对组织与项目做了统一治理:
OPENAI_API_KEY=your-api-key
OPENAI_ORGANIZATION=org-id123
OPENAI_PROJECT=compliance-approved
某些 OpenAI 兼容 endpoint 还要求额外请求头:
OPENAI_API_KEY=your-api-key
OPENAI_ORGANIZATION=org-id123
OPENAI_PROJECT=compliance-approved
OPENAI_CUSTOM_HEADERS="X-Header-A=abc,X-Header-B=def"
配置步骤
- goose Desktop
- goose CLI
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 在 Provider 列表中选择
OpenAI - 填入所需配置:
- API Key(必填)
- Host URL(自定义 endpoint 时填写)
- Organization ID(需要组织级追踪时填写)
- Project(需要项目级治理时填写)
- 点击
Submit
- 运行
goose configure - 选择
Configure Providers - 选择
OpenAI - 按提示输入:
- API Key
- Host URL(如果使用自定义 endpoint)
- Organization ID(如果需要组织追踪)
- Project(如果需要项目管理)
在团队环境里,通常可以通过环境变量或共享配置文件预置这些参数,确保所有 session 都遵循同一套安全和治理要求。
配置自定义 Provider
如果官方列表里没有你要接的服务,或者你想定制连接方式,可以创建自定义 Provider。创建完成后,它会像内置 Provider 一样出现在 provider 列表里。
典型收益:
- 多 endpoint 管理:例如在 vLLM、企业代理和官方 OpenAI 之间快速切换
- 预设模型列表:把常用模型名固化下来,减少手输
- 可共享配置:JSON 文件可以放进仓库,方便团队复用
- 自定义展示名:例如在界面里显示成 “Corporate API”
- 隔离凭据:每个 provider 单独使用自己的 key
自定义 provider 目前要求底层 API 兼容 OpenAI、Anthropic 或 Ollama。你也可以附加自定义请求头,用于租户标识、额外 token 或内部认证字段。
添加自定义 Provider
- goose Desktop
- goose CLI
- 配置文件
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 点击窗口底部的
Add Custom Provider - 逐项填写:
- Provider Type
OpenAI Compatible(最常见)Anthropic CompatibleOllama Compatible
- Display Name:显示给用户看的名称
- API URL:服务的基础地址
- Authentication
- 默认通过自定义环境变量读取 API Key,并存入 keychain
- 如果目标服务不要求授权(例如本地模型或内网服务),取消勾选 This provider requires an API key
- Available Models:逗号分隔的模型列表
- Streaming Support:是否支持流式返回
- Provider Type
- 点击
Create Provider
目前 goose Desktop 还不能直接填写 custom headers。需要的话,先创建 provider,再手动编辑配置文件补上。
-
运行:
goose configure -
选择
Custom Providers┌ goose-configure
│
◆ What would you like to configure?
│ ○ Configure Providers
│ ● Custom Providers (Add custom provider with compatible API)
│ ○ Add Extension
│ ○ Toggle Extensions
│ ○ Remove Extension
│ ○ goose Settings
└ -
选择
Add A Custom Provider -
按提示填写:
- API Type
OpenAI CompatibleAnthropic CompatibleOllama Compatible
- Name
- API URL
- Authentication Required
- 选
Yes时继续输入 API Key - 选
No时跳过 key
- 选
- Available Models
- Streaming Support
- Custom Headers
- API Type
CLI 目前只支持给 OpenAI-compatible provider 直接配置 custom headers。Anthropic / Ollama compatible provider 仍建议创建后手工编辑配置文件。
先在 custom_providers 目录下创建一个 JSON 文件:
- macOS / Linux:
~/.config/goose/custom_providers/ - Windows:
%APPDATA%\\Block\\goose\\config\\custom_providers\\
示例 custom_corp_api.json:
{
"name": "custom_corp_api",
"engine": "openai",
"display_name": "Corporate API",
"description": "Custom Corporate API provider",
"api_key_env": "CUSTOM_CORP_API_API_KEY",
"base_url": "https://api.company.com/v1/chat/completions",
"models": [
{
"name": "gpt-4o",
"context_limit": 128000
},
{
"name": "gpt-3.5-turbo",
"context_limit": 16385
}
],
"headers": {
"x-origin-client-id": "YOUR_CLIENT_ID",
"x-origin-secret": "YOUR_SECRET_VALUE"
},
"supports_streaming": true,
"requires_auth": true
}
然后通过 api_key_env 为当前 session 注入密钥,例如:
export CUSTOM_CORP_API_API_KEY="your-api-key"
goose session start --provider custom_corp_api
如果你希望 key 落到 goose keychain 里,可以先在 Desktop 中创建或更新这个 provider,并在界面里输入 API Key。
更新自定义 Provider
- goose Desktop
- goose CLI
- 配置文件
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 在列表中点击你的自定义 provider
- 修改要更新的字段
- 点击
Update Provider
-
运行:
goose configure -
选择
Configure Providers┌ goose-configure
│
◆ What would you like to configure?
│ ● Configure Providers (Change provider or update credentials)
│ ○ Custom Providers
│ ○ Add Extension
│ ○ Toggle Extensions
│ ○ Remove Extension
│ ○ goose Settings
└ -
从 provider 列表里选中你的自定义 provider。可以用方向键移动,也可以直接输入关键词过滤。
┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Amazon Bedrock
│ ○ Amazon SageMaker TGI
│ ○ Anthropic
│ ○ Azure OpenAI
│ ○ Claude Code CLI
│ ● Corporate API (Custom Corporate API provider)
│ ○ Cursor Agent
│ ○ ...
└ -
按提示更新需要修改的字段
打开 custom_providers 目录中的对应 JSON 文件并直接修改:
- macOS / Linux:
~/.config/goose/custom_providers/ - Windows:
%APPDATA%\\Block\\goose\\config\\custom_providers\\
保存后,新配置会在下一次 goose session 中生效。
删除自定义 Provider
- goose Desktop
- goose CLI
- 配置文件
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 选择要删除的自定义 provider
- 点击
Delete Provider - 确认删除 provider 及其关联的 API Key
-
运行:
goose configure -
选择
Custom Providers┌ goose-configure
│
◆ What would you like to configure?
│ ○ Configure Providers
│ ● Custom Providers (Add custom provider with compatible API)
│ ○ Add Extension
│ ○ Toggle Extensions
│ ○ Remove Extension
│ ○ goose Settings
└ -
选择
Remove Custom Provider┌ goose-configure
│
◇ What would you like to configure?
│ Custom Providers
│
◆ What would you like to do?
│ ○ Add A Custom Provider
│ ● Remove Custom Provider (Remove an existing custom provider)
└ -
选择要移除的 provider
对应的配置文件会从 custom_providers 目录删除;如果 API Key 存在 keychain 中,也会一并清理。
如果 API Key 已存入 keychain,更推荐用 goose CLI 删除,这样可以把配置文件和密钥一起清干净。
直接删除 custom_providers 目录下对应的 JSON 文件:
- macOS / Linux:
~/.config/goose/custom_providers/ - Windows:
%APPDATA%\\Block\\goose\\config\\custom_providers\\
免费开始使用 goose
goose 本身是免费开源的,但不是所有 LLM Providers 都有免费额度。下面列出几个常见的免费起步方案。
这些免费方案很适合先上手,但如果你要处理更复杂、更长上下文或更多工具调用任务,后续通常还是需要升级到更强的模型。
Groq
Groq 提供了若干开源模型的免费高速推理能力。要在 goose 中使用 Groq,需要先到 Groq Console 获取 API Key。
Groq 当前常见可用模型包括:
moonshotai/kimi-k2-instruct-0905:MoE 架构,参数规模非常大,适合更强的 agentic reasoning 和工具使用qwen/qwen3-32b:32.8B 参数,多语言和推理能力比较均衡llama-3.3-70b-versatile:Meta 的 Llama 3.3 通用模型,适合覆盖较广的任务场景llama-3.1-8b-instant:更偏向低延迟推理,适合快速响应
完整支持列表可参考 groq.json。
- goose Desktop
- goose CLI
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure Providers - 选择
Groq - 点击
Configure,输入 API Key 并提交 - 选择想用的 Groq 模型
-
运行:
goose configure -
选择
Configure Providers -
按提示选择
Groq -
输入 API Key
-
选择模型
Google Gemini
Google Gemini 提供免费额度。你需要先到 Google AI Studio 获取 API Key。
- goose Desktop
- goose CLI
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure Providers - 选择
Google Gemini - 点击
Configure,输入 API Key 并提交
-
运行:
goose configure -
选择
Configure Providers -
选择
Google Gemini -
输入
GOOGLE_API_KEY -
输入你要使用的 Gemini 模型名
┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Google Gemini
│
◇ Provider Google Gemini requires GOOGLE_API_KEY, please enter a value
│ ▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪▪
│
◇ Enter a model from that provider:
│ gemini-2.0-flash-exp
│
└ Configuration saved successfully
本地 LLMs
goose 本身就是本地 AI agent。配合本地 LLM,你可以把数据保留在本机,完全离线工作,并保留对运行环境的完全控制。但相应地,前置准备也会更多一些。
goose 高度依赖 tool calling。如果模型不支持 tool calling,它基本只能做聊天补全。这种情况下,你需要关闭所有 goose 扩展。
当前常见的本地 provider 路线包括:
- Ollama
- LM Studio
- Docker Model Runner
- Ramalama
- DeepSeek-R1
- Other Models
-
在终端中启动一个支持 tool calling 的 Ollama 模型,或者一个支持对应格式的 GGUF 模型
--runtime-args="--jinja"是 goose 的 Ollama provider 能正确配合 Ramalama 所必需的。示例:
ramalama serve --runtime-args="--jinja" ollama://qwen2.5 -
在另一个终端里运行:
goose configure -
选择
Configure Providers┌ goose-configure
│
◆ What would you like to configure?
│ ● Configure Providers (Change provider or update credentials)
│ ○ Toggle Extensions
│ ○ Add Extension
└ -
选择
Ollama作为 model provider,因为 Ramalama 的接口兼容 goose 的 Ollama provider┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Anthropic
│ ○ Databricks
│ ○ Google Gemini
│ ○ Groq
│ ● Ollama (Local open source models)
│ ○ OpenAI
│ ○ OpenRouter
└ -
输入模型运行地址
Endpoint如果你不提供 host,Ollama provider 默认使用
localhost:11434。如果没有写http://或https://,goose 会自动补http://。Ramalama 默认端口通常是8080,因此常见值是OLLAMA_HOST=http://0.0.0.0:8080。┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◆ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://0.0.0.0:8080
└ -
输入正在运行的模型名,例如
qwen2.5┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◇ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://0.0.0.0:8080
│
◇ Enter a model from that provider:
│ qwen2.5
│
◇ Welcome! You're all set to explore and utilize my capabilities. Let's get started on solving your problems together!
│
└ Configuration saved successfullyContext Length如果 goose 开始忽略 .goosehints 或扩展调用异常,往往是上下文长度太小。Ramalama 可以通过
--ctx-size/-c提高上下文窗口。
原生 DeepSeek-r1 不支持 tool calling,但你可以使用专门适配 goose 的自定义模型。
这是一个 70B 级别模型,对硬件要求较高。
-
在终端运行:
ollama run michaelneale/deepseek-r1-goose -
在另一个终端运行:
goose configure -
选择
Configure Providers┌ goose-configure
│
◆ What would you like to configure?
│ ● Configure Providers (Change provider or update credentials)
│ ○ Toggle Extensions
│ ○ Add Extension
└ -
选择
Ollama┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Anthropic
│ ○ Databricks
│ ○ Google Gemini
│ ○ Groq
│ ● Ollama (Local open source models)
│ ○ OpenAI
│ ○ OpenRouter
└ -
输入
OLLAMA_HOST,通常是http://localhost:11434┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◆ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://localhost:11434
└ -
输入模型名:
michaelneale/deepseek-r1-goose┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◇ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://localhost:11434
│
◇ Enter a model from that provider:
│ michaelneale/deepseek-r1-goose
│
◇ Welcome! You're all set to explore and utilize my capabilities. Let's get started on solving your problems together!
│
└ Configuration saved successfully
-
在终端运行任意支持 tool calling 的模型,例如:
ollama run qwen2.5 -
在另一个终端运行:
goose configure -
选择
Configure Providers┌ goose-configure
│
◆ What would you like to configure?
│ ● Configure Providers (Change provider or update credentials)
│ ○ Toggle Extensions
│ ○ Add Extension
└ -
选择
Ollama┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Anthropic
│ ○ Databricks
│ ○ Google Gemini
│ ○ Groq
│ ● Ollama (Local open source models)
│ ○ OpenAI
│ ○ OpenRouter
└ -
输入模型地址,默认通常是
http://localhost:11434Endpoint对 Ollama 来说,如果你不提供 host,默认会使用
localhost:11434。如果你把 Ollama 跑在别的机器上,则需要把OLLAMA_HOST改成http://{host}:{port}。┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◆ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://localhost:11434
└ -
输入当前运行的模型名,例如
qwen2.5┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ Ollama
│
◇ Provider Ollama requires OLLAMA_HOST, please enter a value
│ http://localhost:11434
│
◇ Enter a model from that provider:
│ qwen2.5
│
◇ Welcome! You're all set to explore and utilize my capabilities. Let's get started on solving your problems together!
│
└ Configuration saved successfully
如果模型默认上下文太小,goose 可能无法稳定使用扩展或读取 .goosehints。对 Ollama,可以用 OLLAMA_CONTEXT_LENGTH 提高上下文窗口。
LM Studio 可以在本地运行开源模型,并通过 OpenAI 兼容接口提供服务。
- 安装 LM Studio
- 下载一个支持 tool calling 的模型(例如 Qwen、Llama 或 Mistral 变体)
- 启动 LM Studio 的本地服务,默认地址通常是
http://localhost:1234
- goose Desktop
- goose CLI
- 点击左上角的 打开侧边栏
- 点击
Settings - 进入
Models - 点击
Configure providers - 选择
LM Studio - 点击
Submit(通常不需要 API Key) - 选择你在 LM Studio 中加载的模型
-
运行:
goose configure -
选择
Configure Providers -
选择
LM Studio -
输入与你在 LM Studio server 面板里看到的一致模型名,例如:
┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◇ Which model provider should we use?
│ LM Studio
│
◇ Enter a model from that provider:
│ qwen2.5-7b-instruct
│
└ Configuration saved successfully
在 goose 里输入的模型名,要和 LM Studio server 面板中显示的标识一致。
-
拉取模型,例如:
docker model pull hf.co/unsloth/gemma-3n-e4b-it-gguf:q6_k -
运行:
goose configure -
选择
Configure Providers -
选择
OpenAI,因为 Docker Model Runner 提供的是 OpenAI 兼容 endpoint┌ goose-configure
│
◇ What would you like to configure?
│ Configure Providers
│
◆ Which model provider should we use?
│ ○ Anthropic
│ ○ Amazon Bedrock
│ ○ Claude Code
│ ● OpenAI (GPT-4 and other OpenAI models, including OpenAI compatible ones)
│ ○ OpenRouter
└ -
把
OPENAI_HOST改成 Docker Model Runner 的地址,例如http://localhost:12434◆ Provider OpenAI requires OPENAI_HOST, please enter a value
│ https://api.openai.com (default)
└Docker Model Runner 在宿主机上的默认端口通常是
12434,所以常见值就是http://localhost:12434。 -
把
OPENAI_BASE_PATH设置成对应路径。Docker Model Runner 使用/engines/llama.cpp/v1/chat/completions◆ Provider OpenAI requires OPENAI_BASE_PATH, please enter a value
│ v1/chat/completions (default)
└ -
最后输入要使用的模型名,例如
hf.co/unsloth/gemma-3n-e4b-it-gguf:q6_k│
◇ Enter a model from that provider:
│ gpt-4o
│
◒ Checking your configuration...
└ Configuration saved successfully
GitHub Copilot 认证
GitHub Copilot 使用 device flow,不需要手工 API Key:
- 运行 配置 Provider 和模型 中的
goose configure - 选择 GitHub Copilot
- 一个 8 位验证码会自动复制到剪贴板
- 浏览器会打开 GitHub 的设备激活页面
- 粘贴验证码完成授权
- 返回 goose 后,GitHub Copilot 就会在 CLI 和 Desktop 中都可用
Azure OpenAI Credential Chain
goose 对 Azure OpenAI 支持两种认证方式:
- API Key Authentication:使用
AZURE_OPENAI_API_KEY - Azure Credential Chain:自动使用 Azure CLI 登录态,不必显式提供 API Key
如果你要使用 Azure Credential Chain:
- 先执行
az login - 确认当前账号对 Azure OpenAI 服务有足够权限
- 在
goose configure中选择 Azure OpenAI,并把 API Key 留空
对企业环境来说,这种方式通常更安全,也更容易统一管理。
多模型配置
除了单模型方案,goose 还支持多模型配置,让不同模型承担不同角色:
- Lead/Worker Model:前几轮用更强模型做规划,后续用更快或更便宜的模型做执行
- Planning Mode:先用专门模型做任务拆解,再进入执行阶段
Gemini 3 Thinking Levels
Gemini 3 模型支持不同的 thinking level,用来平衡延迟与推理深度:
- Low(默认):更快,推理更轻量
- High:推理更深,但延迟更高
开启 thinking 后,你可以查看模型推理过程。详见 Viewing Model Reasoning。
- goose Desktop
- goose CLI
在 Desktop 中选择 Gemini 3 模型时,会自动出现 “Thinking Level” 下拉框。你选定后,该设置会跨会话保留。
当你在 goose configure 里选择 Gemini 3 模型时,会看到:
◆ Select thinking level for Gemini 3:
│ ● Low - Better latency, lighter reasoning
│ ○ High - Deeper reasoning, higher latency
thinking level 的优先级从高到低依次是:
- 模型配置中的
request_params.thinking_level(通过GOOSE_PREDEFINED_MODELS) GEMINI3_THINKING_LEVEL环境变量- 默认值
low
查看模型推理过程
有些模型会把内部推理或 reasoning 作为响应的一部分暴露出来。goose 会自动捕获这些内容,并在适当位置展示。
当前常见支持情况:
| Provider / Model | 工作方式 |
|---|---|
| DeepSeek-R1(通过 OpenAI、Ollama、OpenRouter、OVHcloud 等) | 从响应里的 reasoning_content 字段提取 |
| Kimi(通过 Groq 或其它 OpenAI 兼容端点) | 从 reasoning_content 字段提取 |
| Gemini CLI(开启 thinking 的 Gemini) | 从流式响应中的 thinking block 捕获 |
| Claude(Anthropic,并开启 extended thinking) | 从 API 响应中的 thinking block 捕获 |
- goose Desktop
- goose CLI
在 Desktop 中,reasoning 会出现在模型回答上方的可折叠区域,通常显示为 Show reasoning。
CLI 默认隐藏 reasoning。若要显示,请设置:
export GOOSE_CLI_SHOW_THINKING=1
开启后,reasoning 会在主回答前以较暗文本显示。
这要求 stdout 必须是终端。如果你把输出 pipe 到文件或其它命令,reasoning 通常不会显示。
查看 reasoning 有助于理解模型为什么给出某个答案,也适合用于调试异常行为或学习模型的拆题方式。但它通常比较冗长,只在需要时开启即可。
如果你在某个 Provider 上遇到问题,可以到 Discord 或 goose repo 继续反馈。