Skip to content

hermes agent AI提供商

本页介绍如何为 Hermes Agent 设置推理提供商 —— 从 OpenRouter 和 Anthropic 等云 API,到 Ollama 和 vLLM 等自托管端点,再到高级路由和备用配置。你至少需要配置一个提供商才能使用 Hermes。

你至少需要一种连接到 LLM 的方式。使用 hermes model 可以交互式切换提供商和模型,也可以直接配置:

提供商设置
Nous Portalhermes model(OAuth,基于订阅)
OpenAI Codexhermes model(ChatGPT OAuth,使用 Codex 模型)
GitHub Copilothermes model(OAuth 设备码流程、COPILOT_GITHUB_TOKENGH_TOKENgh auth token
GitHub Copilot ACPhermes model(启动本地 copilot --acp --stdio
Anthropichermes model(通过 OAuth 使用 Claude Max + 额外使用额度;也支持 Anthropic API key 或手动 setup-token —— 见下方说明)
OpenRouter~/.hermes/.env 中设置 OPENROUTER_API_KEY
NovitaAI~/.hermes/.env 中设置 NOVITA_API_KEY(provider: novita,200+ 模型,Model API、Agent Sandbox、GPU Cloud)
AI Gateway~/.hermes/.env 中设置 AI_GATEWAY_API_KEY(provider: ai-gateway
z.ai / GLM~/.hermes/.env 中设置 GLM_API_KEY(provider: zai
Kimi / Moonshot~/.hermes/.env 中设置 KIMI_API_KEY(provider: kimi-coding
Kimi / Moonshot(中国)~/.hermes/.env 中设置 KIMI_CN_API_KEY(provider: kimi-coding-cn;别名:kimi-cnmoonshot-cn
Arcee AI~/.hermes/.env 中设置 ARCEEAI_API_KEY(provider: arcee;别名:arcee-aiarceeai
GMI Cloud~/.hermes/.env 中设置 GMI_API_KEY(provider: gmi;别名:gmi-cloudgmicloud
MiniMax~/.hermes/.env 中设置 MINIMAX_API_KEY(provider: minimax
MiniMax China~/.hermes/.env 中设置 MINIMAX_CN_API_KEY(provider: minimax-cn
Alibaba Cloud~/.hermes/.env 中设置 DASHSCOPE_API_KEY(provider: alibaba
Alibaba Coding PlanDASHSCOPE_API_KEY(provider: alibaba-coding-plan,别名:alibaba_coding)—— 单独的计费 SKU,不同的端点
Kilo Code~/.hermes/.env 中设置 KILOCODE_API_KEY(provider: kilocode
Xiaomi MiMo~/.hermes/.env 中设置 XIAOMI_API_KEY(provider: xiaomi,别名:mimoxiaomi-mimo
Tencent TokenHub~/.hermes/.env 中设置 TOKENHUB_API_KEY(provider: tencent-tokenhub,别名:tencenttokenhubtencentmaas
OpenCode Zen~/.hermes/.env 中设置 OPENCODE_ZEN_API_KEY(provider: opencode-zen
OpenCode Go~/.hermes/.env 中设置 OPENCODE_GO_API_KEY(provider: opencode-go
DeepSeek~/.hermes/.env 中设置 DEEPSEEK_API_KEY(provider: deepseek
Hugging Face~/.hermes/.env 中设置 HF_TOKEN(provider: huggingface,别名:hf
Google / Gemini~/.hermes/.env 中设置 GOOGLE_API_KEY(或 GEMINI_API_KEY)(provider: gemini
Google Gemini(OAuth)hermes model → “Google Gemini (OAuth)”(provider: google-gemini-cli,支持免费额度,浏览器 PKCE 登录)
LM Studiohermes model → “LM Studio”(provider: lmstudio,可选 LM_API_KEY
Custom Endpointhermes model → 选择 “Custom endpoint”(保存到 config.yaml

对于官方 API key 路径,请参阅专门的 Google Gemini 指南。

通过 OAuth 使用 Google Gemini(google-gemini-cli)

Section titled “通过 OAuth 使用 Google Gemini(google-gemini-cli)”

google-gemini-cli 提供商使用 Google 的 Cloud Code Assist 后端 —— 也就是 Google 自己的 gemini-cli 工具所使用的同一个 API。它同时支持免费层级(个人账号拥有慷慨的每日配额)和付费层级(通过 GCP 项目使用 Standard/Enterprise)。

快速开始:

Terminal window
hermes model
# → 选择 "Google Gemini (OAuth)"
# → 查看政策警告,确认
# → 浏览器打开 accounts.google.com,登录
# → 完成 —— Hermes 会在第一次请求时自动为你配置免费层级

Hermes 默认内置 Google 的公开 gemini-cli 桌面 OAuth 客户端 —— 也就是 Google 在其开源 gemini-cli 中包含的同一组凭据。桌面 OAuth 客户端不是机密客户端(PKCE 提供安全性)。你不需要安装 gemini-cli,也不需要注册自己的 GCP OAuth 客户端。

认证工作方式:

  • PKCE 授权码流程,面向 accounts.google.com
  • 浏览器回调地址为 http://127.0.0.1:8085/oauth2callback(如果端口被占用,则使用临时端口回退)
  • Token 存储在 ~/.hermes/auth/google_oauth.jsonchmod 0600,原子写入,跨进程 fcntl 锁)
  • 在过期前 60 秒自动刷新
  • 无头环境(SSH、HERMES_HEADLESS=1)→ 粘贴模式回退
  • 进行中的刷新去重 —— 两个并发请求不会重复刷新
  • invalid_grant(刷新令牌被撤销)→ 凭据文件被清除,并提示用户重新登录

推理工作方式:

  • 流量发送到 https://cloudcode-pa.googleapis.com/v1internal:generateContent(或用于流式输出的 :streamGenerateContent?alt=sse),而不是付费的 v1beta/openai 端点
  • 请求体会被包装为 {project, model, user_prompt_id, request}
  • OpenAI 形态的 messages[]tools[]tool_choice 会被转换为 Gemini 原生的 contents[]tools[].functionDeclarationstoolConfig 形态
  • 响应会被转换回 OpenAI 形态,因此 Hermes 的其余部分无需改动即可正常工作

层级与项目 ID:

你的情况需要做什么
个人 Google 账号,想使用免费层级什么都不用做 —— 登录后开始聊天
Workspace / Standard / Enterprise 账号设置 HERMES_GEMINI_PROJECT_IDGOOGLE_CLOUD_PROJECT 为你的 GCP 项目 ID
受 VPC-SC 保护的组织Hermes 会检测 SECURITY_POLICY_VIOLATED 并自动强制使用 standard-tier

免费层级会在首次使用时自动配置一个由 Google 管理的项目。不需要 GCP 设置。

配额监控:

Terminal window
/gquota

显示每个模型剩余的 Code Assist 配额,并带有进度条:

Gemini Code Assist quota (project: 123-abc)
gemini-2.5-pro ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓░░░░ 85%
gemini-2.5-flash [input] ▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓░░ 92%

如果你更愿意注册自己的 Google OAuth 客户端 —— 例如,将配额和同意范围限定在你自己的 GCP 项目中 —— 请设置:

Terminal window
HERMES_GEMINI_CLIENT_ID=your-client.apps.googleusercontent.com
HERMES_GEMINI_CLIENT_SECRET=... # 对桌面客户端来说是可选的

console.cloud.google.com/apis/credentials 注册一个桌面应用 OAuth 客户端,并启用 Generative Language API。

警告

即使使用 Nous Portal、Codex 或自定义端点,某些工具(视觉、网页摘要、MoA)也会使用单独的“辅助”模型。默认情况下(auxiliary.*.provider: "auto"),Hermes 会将这些任务路由到你的主聊天模型 —— 也就是你在 hermes model 中选择的同一个模型。你可以单独覆盖每个任务,将其路由到更便宜/更快的模型(例如 OpenRouter 上的 Gemini Flash)—— 请参阅 辅助模型

Hermes 有两个模型命令,它们用于不同的目的:

命令在哪里运行作用
hermes model你的终端中(不在任何会话内)完整设置向导 —— 添加提供商、运行 OAuth、输入 API key、配置端点
/model在 Hermes 聊天会话内在已经配置好的提供商和模型之间快速切换

如果你想切换到一个尚未设置过的提供商(例如你只配置了 OpenRouter,但想使用 Anthropic),你需要使用 hermes model,而不是 /model。先退出当前会话(Ctrl+C/quit),运行 hermes model,完成提供商设置,然后启动一个新会话。

-
0:000:00