Skip to content

hermes agent 集成

Hermes Agent 连接到外部系统,用于 AI 推理、工具服务器、IDE 工作流、程序化访问等。这些集成扩展了 Hermes 的能力以及它可以运行的位置。

Hermes 开箱即支持多个 AI 推理提供商。使用 hermes model 进行交互式配置,或在 config.yaml 中进行设置。

  • AI 提供商 —— OpenRouter、Anthropic、OpenAI、Google,以及任何兼容 OpenAI 的端点。Hermes 会按提供商自动检测视觉、流式输出和工具使用等能力。
  • 提供商路由 —— 对由哪些底层提供商处理你的 OpenRouter 请求进行细粒度控制。通过排序、白名单、黑名单和显式优先级排序,针对成本、速度或质量进行优化。
  • 备用提供商 —— 当主模型遇到错误时,自动故障转移到备用 LLM 提供商。包括主模型备用,以及用于视觉、压缩和网页提取的独立辅助任务备用。
  • MCP 服务器 —— 通过模型上下文协议将 Hermes 连接到外部工具服务器。无需编写原生 Hermes 工具,即可访问来自 GitHub、数据库、文件系统、浏览器栈、内部 API 等的工具。支持 stdio 和 SSE 两种传输方式、按服务器进行工具过滤,以及具备能力感知的资源/提示注册。

web_searchweb_extract 工具支持四种后端提供商,可通过 config.yamlhermes tools 进行配置:

后端环境变量搜索提取爬取
Firecrawl(默认)FIRECRAWL_API_KEY
ParallelPARALLEL_API_KEY
TavilyTAVILY_API_KEY
ExaEXA_API_KEY

快速设置示例:

web:
backend: firecrawl # firecrawl | parallel | tavily | exa

如果未设置 web.backend,则会根据可用的 API key 自动检测后端。也支持通过 FIRECRAWL_API_URL 使用自托管 Firecrawl。

Hermes 包含完整的浏览器自动化能力,并提供多种后端选项,用于浏览网站、填写表单和提取信息:

  • Browserbase —— 托管云浏览器,带有反机器人工具、验证码解决和住宅代理
  • Browser Use —— 另一种云浏览器提供商
  • 通过 CDP 使用本地 Chrome —— 使用 /browser connect 连接到正在运行的 Chrome 实例
  • 本地 Chromium —— 通过 agent-browser CLI 使用无头本地浏览器

有关设置和用法,请参阅 浏览器自动化

跨所有消息平台的文本转语音和语音转文本:

提供商质量成本API Key
Edge TTS(默认)良好免费不需要
ElevenLabs极佳付费ELEVENLABS_API_KEY
OpenAI TTS良好付费VOICE_TOOLS_OPENAI_KEY
MiniMax良好付费MINIMAX_API_KEY
NeuTTS良好免费不需要

语音转文本支持六种提供商:本地 faster-whisper(免费,在设备本地运行)、本地命令包装器、Groq、OpenAI Whisper API、Mistral 和 xAI。语音消息转录可在 Telegram、Discord、WhatsApp 和其他消息平台中使用。详情请参阅 Voice & TTS 和 Voice Mode。

  • IDE 集成(ACP)—— 在兼容 ACP 的编辑器中使用 Hermes Agent,例如 VS Code、Zed 和 JetBrains。Hermes 作为 ACP 服务器运行,在你的编辑器中渲染聊天消息、工具活动、文件差异和终端命令。
  • API 服务器 —— 将 Hermes 暴露为兼容 OpenAI 的 HTTP 端点。任何支持 OpenAI 格式的前端 —— Open WebUI、LobeChat、LibreChat、NextChat、ChatBox —— 都可以连接并将 Hermes 作为后端使用,同时保留其完整工具集。
  • 内置记忆 —— 通过 MEMORY.mdUSER.md 文件实现持久化、经过整理的记忆。Agent 会维护有边界的个人笔记和用户画像数据存储,并在不同会话之间保留。
  • 记忆提供商 —— 接入外部记忆后端,以实现更深层的个性化。支持八种提供商:Honcho(辩证推理)、OpenViking(分层检索)、Mem0(云端提取)、Hindsight(知识图谱)、Holographic(本地 SQLite)、RetainDB(混合搜索)、ByteRover(基于 CLI)和 Supermemory。

Hermes 可作为网关机器人运行在 19+ 个消息平台上,所有平台都通过同一个 gateway 子系统进行配置:

  • Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、Feishu/Lark、WeCom、WeCom Callback、Weixin、BlueBubbles、QQ Bot、Yuanbao、Home Assistant、Microsoft Teams、Webhooks

有关平台对比表和设置指南,请参阅 Messaging Gateway 概览

  • Home Assistant —— 通过四个专用工具控制智能家居设备:ha_list_entitiesha_get_stateha_list_servicesha_call_service。当配置了 HASS_TOKEN 时,Home Assistant 工具集会自动激活。
  • 插件系统 —— 无需修改核心代码,即可使用自定义工具、生命周期钩子和 CLI 命令扩展 Hermes。插件会从 ~/.hermes/plugins/、项目本地的 .hermes/plugins/ 以及通过 pip 安装的入口点中发现。
  • 构建插件 —— 创建包含工具、钩子和 CLI 命令的 Hermes 插件的分步指南。
  • 批处理 —— 并行运行 Agent 处理数百个提示,生成结构化的 ShareGPT 格式轨迹数据,用于训练数据生成或评估。
-
0:000:00