可选技能随 hermes-agent 一起附带在 optional-skills/ 目录下,但 默认并不启用。您需要显式地安装它们:
hermes skills install official/<category>/<skill>例如:
hermes skills install official/blockchain/solanahermes skills install official/mlops/flash-attention下面列出的每个技能都链接到一个专有页面,其中包含其完整的定义、设置和用法。
若要卸载:
hermes skills uninstall <skill-name>自主 AI 智能体
Section titled “自主 AI 智能体”| 技能(Skill) | 描述(Description) |
|---|---|
blackbox | 将编程任务委托给 Blackbox AI 命令行界面(CLI)智能体。这是一款多模型智能体,内置裁判机制,可在多个大语言模型(LLMs)中运行任务并挑选最佳结果。需要安装 blackbox CLI 并配置 Blackbox AI API 密钥。 |
honcho | 配合 Hermes 配置和使用 Honcho 记忆库 —— 包含跨会话用户建模、多配置文件同伴隔离、观察配置、辩证推理、会话摘要以及上下文预算强制执行。可在设置 Honcho 或进行故障排除时使用…… |
区块链(blockchain)
Section titled “区块链(blockchain)”| 技能(Skill) | 描述(Description) |
|---|---|
evm | 只读型 EVM 客户端:支持在 8 条链上查看钱包、代币以及 Gas 费用。 |
hyperliquid | Hyperliquid 市场数据、账户历史记录及交易审查。 |
solana | 查询带有美元(USD)定价的 Solana 区块链数据 —— 包括钱包余额、代币持仓及其价值、交易详情、NFT、巨鲸检测以及实时 network 统计数据。使用 Solana RPC + CoinGecko。无需 API 密钥。 |
沟通交流(communication)
Section titled “沟通交流(communication)”| 技能(Skill) | 描述(Description) |
|---|---|
one-three-one-rule | 用于技术提案和权衡分析的结构化决策框架。当用户面临多种方法之间的选择(如架构决策、工具选择、重构策略、迁移路径)时,该技能提供…… |
创意设计(creative)
Section titled “创意设计(creative)”| 技能(Skill) | 描述(Description) |
|---|---|
blender-mcp | 通过 socket 连接到 blender-mcp 插件,直接从 Hermes 控制 Blender。创建 3D 对象、材质、动画,并运行任意 Blender Python (bpy) 代码。适用于用户想要在 Blender 中创建或修改任何内容时。 |
concept-diagrams | 生成扁平、极简且支持明暗主题切换的 SVG 图表,并输出为独立的 HTML 文件。使用统一的教育类视觉语言,包含 9 种语义颜色渐变、句首大写排版以及自动暗黑模式。最适合教育和非…… |
hyperframes | 使用 HyperFrames 创建基于 HTML 的视频合成、动画片头、社交贴片、带字幕的单人出镜视频、音频联动视觉效果以及 shader 过渡动画。HTML 是视频的唯一事实来源。适用于用户想要……时。 |
kanban-video-orchestrator | 规划、建立和监控由 Hermes 看板(Kanban)支持的多智能体视频制作流水线。当用户想要制作任何视频 —— 叙事电影、产品/营销视频、音乐录影带(MV)、解说视频、ASCII/终端艺术、抽象/生成式循环动画时使用…… |
meme-generation | 通过选择模板并使用 Pillow 叠加文字来生成真实的迷因(meme)图片。生成实际的 .png 格式迷因文件。 |
开发运维(devops)
Section titled “开发运维(devops)”| 技能(Skill) | 描述(Description) |
|---|---|
inference-sh-cli | 通过 inference.sh CLI(infsh)运行超过 150 款 AI 应用 —— 涵盖图像生成、视频创作、大语言模型、搜索、3D 以及社交自动化。使用终端工具。触发词:inference.sh、infsh、ai apps、flux、veo、image generation、video generation、seedrea…… |
docker-management | 管理 Docker 容器、镜像、数据卷、网络和 Compose 技术栈 —— 包含生命周期操作、调试、清理以及 Dockerfile 优化。 |
watchers | 轮询 RSS、JSON API 和 GitHub,并具备基于水印的去重功能。 |
内部测试(dogfood)
Section titled “内部测试(dogfood)”| 技能(Skill) | 描述(Description) |
|---|---|
adversarial-ux-test | 角色扮演您产品中最挑剔、抗拒技术的用户。以该人设浏览应用,寻找每一个用户体验(UX)痛点,然后通过务实层过滤抱怨,将真正的痛点与杂音区分开来。创建具有可操作性的工单…… |
电子邮件(email)
Section titled “电子邮件(email)”| 技能(Skill) | 描述(Description) |
|---|---|
agentmail | 通过 AgentMail 为智能体提供其专用的独立邮箱。使用智能体拥有的专属邮箱地址(例如 hermes-agent@agentmail.to)自主发送、接收和管理电子邮件。 |
金融财务(finance)
Section titled “金融财务(finance)”| 技能(Skill) | 描述(Description) |
|---|---|
3-statement-model | 在 Excel 中构建完全集成的三张表模型(利润表、资产负债表、现金流量表),包含营运资金变动表、折旧与摊销(D&A)滚结表、债务偿还表以及用于平衡现金和留存收益的轧平项(plugs)。可与 excel-author 配合使用。 |
comps-analysis | 在 Excel 中构建可比公司分析(Comps)—— 包含运营指标、估值倍数、相较于同行组的统计基准测试。可与 excel-author 配合使用。适用于上市公司估值、IPO 定价、行业基准测试或异常值检测。 |
dcf-model | 在 Excel 中构建机构级现金流折现(DCF)估值模型 —— 包含收入预测、自由现金流(FCF)构建、加权平均资本成本(WACC)、终值、悲观/基准/乐观情景分析、5x5 敏感性分析表。可与 excel-author 配合使用。适用于内在价值权益分析。 |
excel-author | 使用 openpyxl 以无头(headless)方式构建可审计的 Excel 工作薄 —— 遵循蓝/黑/绿单元格规范、公式优先于硬编码、命名区域、平衡检查、敏感性分析表。适用于财务模型、审计输出、账目核对。 |
lbo-model | 在 Excel 中构建杠杆收购(LBO)模型 —— 包含资金来源与运用、债务偿还表、现金清扫(cash sweep)、退出倍数、IRR/MOIC 敏感性分析。可与 excel-author 配合使用。适用于私募股权(PE)筛选、赞助商案例估值或投资宣讲中的插图性 LBO 演示。 |
merger-model | 在 Excel 中构建增厚/稀释(并购)模型 —— 包含备考损益表(pro-forma P&L)、协同效应、融资组合、每股收益(EPS)影响。可与 excel-author 配合使用。适用于 M&A 宣讲、董事会材料或交易评估。 |
pptx-author | 使用 python-pptx 以无头(headless)方式构建 PowerPoint 幻灯片。与 excel-author 配合使用以制作有模型支撑的幻灯片,其中每个数字都可以追溯到工作簿的单元格。适用于宣讲材料(pitch decks)、投资委员会(IC)备忘录、业绩简报。 |
stocks | 通过 Yahoo 查询股票行情、历史数据、搜索、对比以及加密货币信息。 |
健康医疗(health)
Section titled “健康医疗(health)”| 技能(Skill) | 描述(Description) |
|---|---|
fitness-nutrition | 健身房锻炼计划和营养追踪器。通过 wger 按肌肉、设备或分类搜索 690 多种练习。通过美国农业部(USDA)FoodData Central 查询 380,000 多种食品的宏量营养素和卡路里。计算 BMI、TDEE、单次最大负重(1RM)、宏量比例以及身体…… |
neuroskill-bci | 连接到运行中的 NeuroSkill 实例,并将用户的实时认知和情感状态(专注度、放松度、情绪、认知负荷、困倦度、心率、心率变异性 HRV、睡眠分期以及 40 多个派生的 EXG 评分)融入到回复中…… |
模型上下文协议(mcp)
Section titled “模型上下文协议(mcp)”| 技能(Skill) | 描述(Description) |
|---|---|
fastmcp | 在 Python 中使用 FastMCP 构建、测试、检查、安装和部署 MCP 服务器。适用于创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、开放资源或提示词,或者为 Claude Code、Cursor 准备 FastMCP 服务器。 |
mcporter | 使用 mcporter 命令行工具(CLI)直接列出、配置、认证和调用 MCP 服务器/工具(通过 HTTP 或 stdio),包括临时服务器、配置编辑以及 CLI/类型生成。 |
迁移导入(migration)
Section titled “迁移导入(migration)”| 技能(Skill) | 描述(Description) |
|---|---|
openclaw-migration | 将用户的 OpenClaw 自定义痕迹迁移到 Hermes Agent 中。从 ~/.openclaw 导入与 Hermes 兼容的记忆库、SOUL.md、命令白名单、用户技能以及选定的工作区资产,并精确报告哪些内容无法被迁移…… |
机器学习运维(mlops)
Section titled “机器学习运维(mlops)”| 技能(Skill) | 描述(Description) |
|---|---|
huggingface-accelerate | 最简单的分布式训练 API。只需添加 4 行代码即可为任何 PyTorch 脚本提供分布式支持。为 DeepSpeed/FSDP/Megatron/DDP 提供统一的 API。支持自动设备分配、混合精度(FP16/BF16/FP8)。提供交互式配置和单命令启动…… |
axolotl | Axolotl:基于 YAML 配置的语言模型微调框架(支持 LoRA、DPO、GRPO)。 |
chroma | 专为 AI 应用打造的开源嵌入(embedding)数据库。用于存储嵌入向量及其元数据,支持向量搜索和全文检索,并可按元数据进行过滤。提供简单的 4 函数 API。支持从 Notebook 扩展到生产线集群。适用于语义搜索、RAG 等场景。 |
clip | OpenAI 连接视觉与语言的模型。可实现零样本(zero-shot)图像分类、图文匹配以及跨模态检索。基于 4 亿对图文数据训练而成。适用于图像搜索、内容审核或视觉语言任务……时。 |
faiss | Facebook 用于高效相似度搜索和稠密向量聚类的库。支持数十亿级向量、GPU 加速以及多种索引类型(Flat、IVF、HNSW)。适用于快速 k-NN 搜索、大规模向量检索,或在……时使用。 |
optimizing-attention-flash | 通过 Flash Attention 优化 Transformer 的注意力机制,可带来 2-4 倍的提速并减少 10-20 倍的显存占用。适用于训练/运行长序列(>512 令牌)的 Transformer、在注意力机制上遇到 GPU 显存不足问题,或者需要更快推理……时。 |
guidance | 通过正则表达式和语法规约控制语言模型输出,确保生成合法的 JSON/XML/代码,强制执行结构化格式,并使用 Guidance(微软研究院的受约束生成框架)构建多步骤工作流。 |
huggingface-tokenizers | 针对 research 和生产环境进行优化的高效分词器(Tokenizers)。基于 Rust 实现,可在 20 秒内完成 1GB 文本的分词。支持 BPE、WordPiece 和 Unigram 算法。支持训练自定义词表、追踪对齐情况、处理填充/截断。集成…… |
instructor | 通过 Pydantic 校验从语言模型响应中提取结构化数据,自动对失败的提取进行重试,具备类型安全地解析复杂 JSON,并使用 Instructor(经受实战检验的结构化输出库)流式传输部分结果。 |
lambda-labs-gpu-cloud | 用于机器学习训练和推理的预留型及按需型 GPU 云实例。当您需要具备简单 SSH 访问权限的专用 GPU 实例、持久化文件系统,或者用于大规模训练的高性能多节点集群时使用。 |
llava | 大型语言与视觉助手(Large Language and Vision Assistant)。支持视觉指令微调和基于图像的对话。将 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型相结合。支持多轮图像对话、视觉问答以及指令…… |
modal-serverless-gpu | 用于运行机器学习工作负载的无服务器(Serverless)GPU 云平台。当您需要按需获取 GPU 访问权限而无需管理基础设施、将机器学习模型部署为 API,或者运行具备自动扩展功能的批处理任务时使用。 |
nemo-curator | GPU 加速的大语言模型训练数据清洗工具。支持文本/图像/视频/音频。具备模糊去重(提速 16 倍)、质量过滤(30+ 启发式规则)、语义去重、个人隐私信息(PII)脱敏、NSFW(不适宜工作场所内容)检测等功能。可通过……在多张 GPU 上扩展。 |
outlines | Outlines:大语言模型结构化 JSON/正则表达式/Pydantic 生成工具。 |
peft-fine-tuning | 使用 LoRA、QLoRA 等 25+ 种方法对大语言模型进行参数高效微调(PEFT)。适用于在有限的 GPU 显存下微调大模型(7B-70B)、在精度损失极小的前提下仅训练 <1% 的参数,或者用于多适配器(multi-adapter)设置…… |
pinecone | 面向生产级 AI 应用的托管型向量数据库。完全托管、自动扩展,支持混合搜索(稠密 + 稀疏)、元数据过滤和命名空间。具备低延迟(p95 <100ms)。适用于生产环境的 RAG、推荐系统或服务…… |
pytorch-fsdp | 为使用 PyTorch FSDP 进行完全分片数据并行(Fully Sharded Data Parallel)训练提供专家级指导 —— 包含参数分片、混合精度、CPU 卸载(offloading)以及 FSDP2。 |
pytorch-lightning | 高阶 PyTorch 框架,配备 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调(callbacks)系统,并将样板代码减至最少。同一套代码可从笔记本电脑扩展到超级计算机。适用于希望获得整洁训练循环……时。 |
qdrant-vector-search | 面向 RAG 和语义搜索的高性能向量相似度搜索引擎。适用于构建需要快速近邻搜索、带过滤的混合搜索,或者基于 Rust 强劲性能实现可扩展向量存储的生产级 RAG 系统。 |
sparse-autoencoder-training | 为使用 SAELens 训练和分析稀疏自编码器(SAE)提供指导,从而将神经网络的激活值分解为可解释的特征。适用于发现可解释特征、分析叠加(superposition)或研究……时。 |
simpo-training | 适用于大语言模型对齐的简单偏好优化(Simple Preference Optimization)。作为 DPO 的免参考模型替代方案,具备更佳的性能(在 AlpacaEval 2.0 上提升了 6.4 分)。无需参考模型,比 DPO 更高效。当需要更简单的偏好对齐时使用…… |
slime-rl-training | 提供使用 slime(一个 Megatron+SGLang 框架)通过强化学习(RL)进行大语言模型后训练(post-training)的指导。适用于训练 GLM 模型、实现自定义数据生成工作流,或者在强化学习扩展中需要紧密的 Megatron-LM 集成时。 |
stable-diffusion-image-generation | 通过 HuggingFace Diffusers 使用 Stable Diffusion 模型进行顶尖的文本生成图像。适用于根据文本提示词生成图像、执行图像转图像(image-to-image)转换、局部重绘(inpainting)或构建自定义扩散流水线。 |
tensorrt-llm | 通过 NVIDIA TensorRT 优化大语言模型推理,以实现最大吞吐量和最低延迟。适用于在 NVIDIA GPU(A100/H100)上进行生产级部署、当您需要比 PyTorch快 10-100 倍的推理,或者用于提供带量化的模型服务时…… |
distributed-llm-pretraining-torchtitan | 使用 torchtitan 并通过 4D 并行(FSDP2、TP、PP、CP)提供 PyTorch 原生的分布式大语言模型预训练。适用于在 8 到 512+ 张 GPU 上,配合 Float8、torch.compile 和分布式……大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型。 |
fine-tuning-with-trl | TRL:用于大语言模型基于人类反馈的强化学习(RLHF)的 SFT、DPO、PPO、GRPO 以及奖励模型(reward modeling)构建。 |
unsloth | Unsloth:令 LoRA/QLoRA 微调速度提升 2-5 倍,且占用更少的显存(VRAM)。 |
whisper | OpenAI 的通用语音识别模型。支持 99 种语言、语音转文字(誊录)、翻译为英文以及语言识别。提供从 tiny(39M 参数)到 large(1550M 参数)的六种模型尺寸。适用于语音转文本、播客…… |
效率办公(productivity)
Section titled “效率办公(productivity)”| 技能(Skill) | 描述(Description) |
|---|---|
canvas | Canvas LMS 集成 —— 通过 API 令牌认证获取已注册的课程和作业。 |
here.now | 将静态网站发布至 {slug}.here.now,并将私有文件存储在云端云盘中以供智能体之间进行交接。 |
memento-flashcards | 间隔重复闪卡系统。可根据事实或文本创建卡片,通过智能体评分的自由文本回答与闪卡进行对话,根据 YouTube 字幕生成测验,通过自适应调度复习到期的卡片,以及进行导入/导出…… |
shop-app | Shop.app:商品搜索、订单追踪、退货、重新下单。 |
shopify | 通过 curl 调用 Shopify 管理后台(Admin)与在线商店(Storefront)的 GraphQL API。管理商品、订单、客户、库存、元字段(metafields)。 |
siyuan | 思源笔记(SiYuan Note)API:通过 curl 在自托管的知识库中搜索、阅读、创建和管理区块(blocks)与文档。 |
telephony | 在不改变核心工具的前提下赋予 Hermes 电话功能。配置并持久化一个 Twilio 号码,发送和接收短信/彩信(SMS/MMS),拨打直接电话,并通过 Bland.ai 或 Vapi 拨打 AI 驱动的外呼电话。 |
学术研究(research)
Section titled “学术研究(research)”| 技能(Skill) | 描述(Description) |
|---|---|
bioinformatics | 接入来自 bioSkills 和 ClawBio 的 400 多项生物信息学技能。涵盖基因组学、转录组学、单细胞分析、变异调用、药物基因组学、宏基因组学、结构生物学等领域。获取特定领域的参考资料…… |
domain-intel | 使用 Python 标准库进行被动域名侦察。包含子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录、域名可用性检查以及大批量多域名分析。无需 API 密钥。 |
drug-discovery | 用于药物研发工作流的制药研究助手。在 ChEMBL 上搜索生物活性化合物,计算类药性(林匹斯基五规则 Lipinski Ro5、QED、TPSA、合成可得性),通过 OpenFDA 查询药物相互作用,解读 ADMET…… |
duckduckgo-search | 通过 DuckDuckGo 进行免费网页搜索 —— 包含文本、新闻、图片、视频。无需 API 密钥。安装后优先使用 ddgs 命令行工具;仅在验证当前运行环境中提供 ddgs 后才使用 Python DDGS 库。 |
gitnexus-explorer | 使用 GitNexus 为代码库建立索引,并通过 Web 界面 + Cloudflare 隧道提供交互式知识图谱。 |
parallel-cli | 适用于 Parallel CLI 的可选厂商技能 —— 智能体原生的网页搜索、信息提取、深度研究、丰富化、FindAll(查找全部)以及监控。优先使用 JSON 输出和非交互式流程。 |
qmd | 使用 qmd 在本地搜索个人知识库、笔记、文档和会议纪要 —— 这是一个结合了 BM25、向量搜索和大语言模型重排(reranking)的混合检索引擎。支持命令行(CLI)和 MCP 集成。 |
scrapling | 使用 Scrapling 进行网络爬取 —— 通过命令行(CLI)和 Python 进行 HTTP 获取、隐身浏览器自动化、绕过 Cloudflare 以及蜘蛛爬虫。 |
searxng-search | 通过 SearXNG 进行免费元搜索 —— 聚合了 70 多个搜索引擎的结果。可自托管或使用公共实例。无需 API 密钥。在网页搜索工具集不可用时会自动降级使用。 |
网络安全(security)
Section titled “网络安全(security)”| 技能(Skill) | 描述(Description) |
|---|---|
1password | 设置和使用 1Password 命令行工具(op)。在安装该 CLI、启用桌面应用集成、登录以及为命令读取/注入机密信息时使用。 |
oss-forensics | 针对 GitHub 仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交(commit)的恢复、强推(force-push)检测、失陷指标(IOC)提取、多源证据收集、假设形成与验证,以及…… |
sherlock | 跨越 400 多个社交网络的开源情报(OSINT)用户名搜索。通过用户名追踪社交媒体账号。 |
软件开发(software-development)
Section titled “软件开发(software-development)”| 技能(Skill) | 描述(Description) |
|---|---|
rest-graphql-debug | 调试 REST/GraphQL API:分析状态码、身份验证、Schema 规范以及问题复现。 |
Web 开发(web-development)
Section titled “Web 开发(web-development)”| 技能(Skill) | 描述(Description) |
|---|---|
page-agent | 将阿里巴巴的 page-agent 嵌入到您自己的 Web 应用程序中 —— 这是一个纯 JavaScript 的页内 GUI 智能体,以单个 <script> 标签或 npm 包的形式提供,让您网站的最终用户能够通过自然语言来驱动界面(例如“点击登录,填写用户名……”)。 |
贡献可选技能(Contributing Optional Skills)
Section titled “贡献可选技能(Contributing Optional Skills)”若要向仓库中添加新的可选技能:
- 在
optional-skills/<category>/<skill-name>/下创建一个目录 - 添加一个带有标准前置元数据(name、description、version、author)的
SKILL.md文件 - 在
references/、templates/或scripts/子目录中包含任何配套支持文件 - 提交拉取请求(PR) —— 一旦合并,该技能将出现在此目录中并获得其专属的文档页面