Skip to content

可选技能目录

hermes agent 可选技能目录

可选技能随 hermes-agent 一起附带在 optional-skills/ 目录下,但 默认并不启用。您需要显式地安装它们:

Terminal window
hermes skills install official/<category>/<skill>

例如:

Terminal window
hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention

下面列出的每个技能都链接到一个专有页面,其中包含其完整的定义、设置和用法。

若要卸载:

Terminal window
hermes skills uninstall <skill-name>
技能(Skill)描述(Description)
blackbox将编程任务委托给 Blackbox AI 命令行界面(CLI)智能体。这是一款多模型智能体,内置裁判机制,可在多个大语言模型(LLMs)中运行任务并挑选最佳结果。需要安装 blackbox CLI 并配置 Blackbox AI API 密钥。
honcho配合 Hermes 配置和使用 Honcho 记忆库 —— 包含跨会话用户建模、多配置文件同伴隔离、观察配置、辩证推理、会话摘要以及上下文预算强制执行。可在设置 Honcho 或进行故障排除时使用……
技能(Skill)描述(Description)
evm只读型 EVM 客户端:支持在 8 条链上查看钱包、代币以及 Gas 费用。
hyperliquidHyperliquid 市场数据、账户历史记录及交易审查。
solana查询带有美元(USD)定价的 Solana 区块链数据 —— 包括钱包余额、代币持仓及其价值、交易详情、NFT、巨鲸检测以及实时 network 统计数据。使用 Solana RPC + CoinGecko。无需 API 密钥。
技能(Skill)描述(Description)
one-three-one-rule用于技术提案和权衡分析的结构化决策框架。当用户面临多种方法之间的选择(如架构决策、工具选择、重构策略、迁移路径)时,该技能提供……
技能(Skill)描述(Description)
blender-mcp通过 socket 连接到 blender-mcp 插件,直接从 Hermes 控制 Blender。创建 3D 对象、材质、动画,并运行任意 Blender Python (bpy) 代码。适用于用户想要在 Blender 中创建或修改任何内容时。
concept-diagrams生成扁平、极简且支持明暗主题切换的 SVG 图表,并输出为独立的 HTML 文件。使用统一的教育类视觉语言,包含 9 种语义颜色渐变、句首大写排版以及自动暗黑模式。最适合教育和非……
hyperframes使用 HyperFrames 创建基于 HTML 的视频合成、动画片头、社交贴片、带字幕的单人出镜视频、音频联动视觉效果以及 shader 过渡动画。HTML 是视频的唯一事实来源。适用于用户想要……时。
kanban-video-orchestrator规划、建立和监控由 Hermes 看板(Kanban)支持的多智能体视频制作流水线。当用户想要制作任何视频 —— 叙事电影、产品/营销视频、音乐录影带(MV)、解说视频、ASCII/终端艺术、抽象/生成式循环动画时使用……
meme-generation通过选择模板并使用 Pillow 叠加文字来生成真实的迷因(meme)图片。生成实际的 .png 格式迷因文件。
技能(Skill)描述(Description)
inference-sh-cli通过 inference.sh CLI(infsh)运行超过 150 款 AI 应用 —— 涵盖图像生成、视频创作、大语言模型、搜索、3D 以及社交自动化。使用终端工具。触发词:inference.sh、infsh、ai apps、flux、veo、image generation、video generation、seedrea……
docker-management管理 Docker 容器、镜像、数据卷、网络和 Compose 技术栈 —— 包含生命周期操作、调试、清理以及 Dockerfile 优化。
watchers轮询 RSS、JSON API 和 GitHub,并具备基于水印的去重功能。
技能(Skill)描述(Description)
adversarial-ux-test角色扮演您产品中最挑剔、抗拒技术的用户。以该人设浏览应用,寻找每一个用户体验(UX)痛点,然后通过务实层过滤抱怨,将真正的痛点与杂音区分开来。创建具有可操作性的工单……
技能(Skill)描述(Description)
agentmail通过 AgentMail 为智能体提供其专用的独立邮箱。使用智能体拥有的专属邮箱地址(例如 hermes-agent@agentmail.to)自主发送、接收和管理电子邮件。
技能(Skill)描述(Description)
3-statement-model在 Excel 中构建完全集成的三张表模型(利润表、资产负债表、现金流量表),包含营运资金变动表、折旧与摊销(D&A)滚结表、债务偿还表以及用于平衡现金和留存收益的轧平项(plugs)。可与 excel-author 配合使用。
comps-analysis在 Excel 中构建可比公司分析(Comps)—— 包含运营指标、估值倍数、相较于同行组的统计基准测试。可与 excel-author 配合使用。适用于上市公司估值、IPO 定价、行业基准测试或异常值检测。
dcf-model在 Excel 中构建机构级现金流折现(DCF)估值模型 —— 包含收入预测、自由现金流(FCF)构建、加权平均资本成本(WACC)、终值、悲观/基准/乐观情景分析、5x5 敏感性分析表。可与 excel-author 配合使用。适用于内在价值权益分析。
excel-author使用 openpyxl 以无头(headless)方式构建可审计的 Excel 工作薄 —— 遵循蓝/黑/绿单元格规范、公式优先于硬编码、命名区域、平衡检查、敏感性分析表。适用于财务模型、审计输出、账目核对。
lbo-model在 Excel 中构建杠杆收购(LBO)模型 —— 包含资金来源与运用、债务偿还表、现金清扫(cash sweep)、退出倍数、IRR/MOIC 敏感性分析。可与 excel-author 配合使用。适用于私募股权(PE)筛选、赞助商案例估值或投资宣讲中的插图性 LBO 演示。
merger-model在 Excel 中构建增厚/稀释(并购)模型 —— 包含备考损益表(pro-forma P&L)、协同效应、融资组合、每股收益(EPS)影响。可与 excel-author 配合使用。适用于 M&A 宣讲、董事会材料或交易评估。
pptx-author使用 python-pptx 以无头(headless)方式构建 PowerPoint 幻灯片。与 excel-author 配合使用以制作有模型支撑的幻灯片,其中每个数字都可以追溯到工作簿的单元格。适用于宣讲材料(pitch decks)、投资委员会(IC)备忘录、业绩简报。
stocks通过 Yahoo 查询股票行情、历史数据、搜索、对比以及加密货币信息。
技能(Skill)描述(Description)
fitness-nutrition健身房锻炼计划和营养追踪器。通过 wger 按肌肉、设备或分类搜索 690 多种练习。通过美国农业部(USDA)FoodData Central 查询 380,000 多种食品的宏量营养素和卡路里。计算 BMI、TDEE、单次最大负重(1RM)、宏量比例以及身体……
neuroskill-bci连接到运行中的 NeuroSkill 实例,并将用户的实时认知和情感状态(专注度、放松度、情绪、认知负荷、困倦度、心率、心率变异性 HRV、睡眠分期以及 40 多个派生的 EXG 评分)融入到回复中……
技能(Skill)描述(Description)
fastmcp在 Python 中使用 FastMCP 构建、测试、检查、安装和部署 MCP 服务器。适用于创建新的 MCP 服务器、将 API 或数据库封装为 MCP 工具、开放资源或提示词,或者为 Claude Code、Cursor 准备 FastMCP 服务器。
mcporter使用 mcporter 命令行工具(CLI)直接列出、配置、认证和调用 MCP 服务器/工具(通过 HTTP 或 stdio),包括临时服务器、配置编辑以及 CLI/类型生成。
技能(Skill)描述(Description)
openclaw-migration将用户的 OpenClaw 自定义痕迹迁移到 Hermes Agent 中。从 ~/.openclaw 导入与 Hermes 兼容的记忆库、SOUL.md、命令白名单、用户技能以及选定的工作区资产,并精确报告哪些内容无法被迁移……
技能(Skill)描述(Description)
huggingface-accelerate最简单的分布式训练 API。只需添加 4 行代码即可为任何 PyTorch 脚本提供分布式支持。为 DeepSpeed/FSDP/Megatron/DDP 提供统一的 API。支持自动设备分配、混合精度(FP16/BF16/FP8)。提供交互式配置和单命令启动……
axolotlAxolotl:基于 YAML 配置的语言模型微调框架(支持 LoRA、DPO、GRPO)。
chroma专为 AI 应用打造的开源嵌入(embedding)数据库。用于存储嵌入向量及其元数据,支持向量搜索和全文检索,并可按元数据进行过滤。提供简单的 4 函数 API。支持从 Notebook 扩展到生产线集群。适用于语义搜索、RAG 等场景。
clipOpenAI 连接视觉与语言的模型。可实现零样本(zero-shot)图像分类、图文匹配以及跨模态检索。基于 4 亿对图文数据训练而成。适用于图像搜索、内容审核或视觉语言任务……时。
faissFacebook 用于高效相似度搜索和稠密向量聚类的库。支持数十亿级向量、GPU 加速以及多种索引类型(Flat、IVF、HNSW)。适用于快速 k-NN 搜索、大规模向量检索,或在……时使用。
optimizing-attention-flash通过 Flash Attention 优化 Transformer 的注意力机制,可带来 2-4 倍的提速并减少 10-20 倍的显存占用。适用于训练/运行长序列(>512 令牌)的 Transformer、在注意力机制上遇到 GPU 显存不足问题,或者需要更快推理……时。
guidance通过正则表达式和语法规约控制语言模型输出,确保生成合法的 JSON/XML/代码,强制执行结构化格式,并使用 Guidance(微软研究院的受约束生成框架)构建多步骤工作流。
huggingface-tokenizers针对 research 和生产环境进行优化的高效分词器(Tokenizers)。基于 Rust 实现,可在 20 秒内完成 1GB 文本的分词。支持 BPE、WordPiece 和 Unigram 算法。支持训练自定义词表、追踪对齐情况、处理填充/截断。集成……
instructor通过 Pydantic 校验从语言模型响应中提取结构化数据,自动对失败的提取进行重试,具备类型安全地解析复杂 JSON,并使用 Instructor(经受实战检验的结构化输出库)流式传输部分结果。
lambda-labs-gpu-cloud用于机器学习训练和推理的预留型及按需型 GPU 云实例。当您需要具备简单 SSH 访问权限的专用 GPU 实例、持久化文件系统,或者用于大规模训练的高性能多节点集群时使用。
llava大型语言与视觉助手(Large Language and Vision Assistant)。支持视觉指令微调和基于图像的对话。将 CLIP 视觉编码器与 Vicuna/LLaMA 语言模型相结合。支持多轮图像对话、视觉问答以及指令……
modal-serverless-gpu用于运行机器学习工作负载的无服务器(Serverless)GPU 云平台。当您需要按需获取 GPU 访问权限而无需管理基础设施、将机器学习模型部署为 API,或者运行具备自动扩展功能的批处理任务时使用。
nemo-curatorGPU 加速的大语言模型训练数据清洗工具。支持文本/图像/视频/音频。具备模糊去重(提速 16 倍)、质量过滤(30+ 启发式规则)、语义去重、个人隐私信息(PII)脱敏、NSFW(不适宜工作场所内容)检测等功能。可通过……在多张 GPU 上扩展。
outlinesOutlines:大语言模型结构化 JSON/正则表达式/Pydantic 生成工具。
peft-fine-tuning使用 LoRA、QLoRA 等 25+ 种方法对大语言模型进行参数高效微调(PEFT)。适用于在有限的 GPU 显存下微调大模型(7B-70B)、在精度损失极小的前提下仅训练 <1% 的参数,或者用于多适配器(multi-adapter)设置……
pinecone面向生产级 AI 应用的托管型向量数据库。完全托管、自动扩展,支持混合搜索(稠密 + 稀疏)、元数据过滤和命名空间。具备低延迟(p95 <100ms)。适用于生产环境的 RAG、推荐系统或服务……
pytorch-fsdp为使用 PyTorch FSDP 进行完全分片数据并行(Fully Sharded Data Parallel)训练提供专家级指导 —— 包含参数分片、混合精度、CPU 卸载(offloading)以及 FSDP2。
pytorch-lightning高阶 PyTorch 框架,配备 Trainer 类、自动分布式训练(DDP/FSDP/DeepSpeed)、回调(callbacks)系统,并将样板代码减至最少。同一套代码可从笔记本电脑扩展到超级计算机。适用于希望获得整洁训练循环……时。
qdrant-vector-search面向 RAG 和语义搜索的高性能向量相似度搜索引擎。适用于构建需要快速近邻搜索、带过滤的混合搜索,或者基于 Rust 强劲性能实现可扩展向量存储的生产级 RAG 系统。
sparse-autoencoder-training为使用 SAELens 训练和分析稀疏自编码器(SAE)提供指导,从而将神经网络的激活值分解为可解释的特征。适用于发现可解释特征、分析叠加(superposition)或研究……时。
simpo-training适用于大语言模型对齐的简单偏好优化(Simple Preference Optimization)。作为 DPO 的免参考模型替代方案,具备更佳的性能(在 AlpacaEval 2.0 上提升了 6.4 分)。无需参考模型,比 DPO 更高效。当需要更简单的偏好对齐时使用……
slime-rl-training提供使用 slime(一个 Megatron+SGLang 框架)通过强化学习(RL)进行大语言模型后训练(post-training)的指导。适用于训练 GLM 模型、实现自定义数据生成工作流,或者在强化学习扩展中需要紧密的 Megatron-LM 集成时。
stable-diffusion-image-generation通过 HuggingFace Diffusers 使用 Stable Diffusion 模型进行顶尖的文本生成图像。适用于根据文本提示词生成图像、执行图像转图像(image-to-image)转换、局部重绘(inpainting)或构建自定义扩散流水线。
tensorrt-llm通过 NVIDIA TensorRT 优化大语言模型推理,以实现最大吞吐量和最低延迟。适用于在 NVIDIA GPU(A100/H100)上进行生产级部署、当您需要比 PyTorch快 10-100 倍的推理,或者用于提供带量化的模型服务时……
distributed-llm-pretraining-torchtitan使用 torchtitan 并通过 4D 并行(FSDP2、TP、PP、CP)提供 PyTorch 原生的分布式大语言模型预训练。适用于在 8 到 512+ 张 GPU 上,配合 Float8、torch.compile 和分布式……大规模预训练 Llama 3.1、DeepSeek V3 或自定义模型。
fine-tuning-with-trlTRL:用于大语言模型基于人类反馈的强化学习(RLHF)的 SFT、DPO、PPO、GRPO 以及奖励模型(reward modeling)构建。
unslothUnsloth:令 LoRA/QLoRA 微调速度提升 2-5 倍,且占用更少的显存(VRAM)。
whisperOpenAI 的通用语音识别模型。支持 99 种语言、语音转文字(誊录)、翻译为英文以及语言识别。提供从 tiny(39M 参数)到 large(1550M 参数)的六种模型尺寸。适用于语音转文本、播客……
技能(Skill)描述(Description)
canvasCanvas LMS 集成 —— 通过 API 令牌认证获取已注册的课程和作业。
here.now将静态网站发布至 {slug}.here.now,并将私有文件存储在云端云盘中以供智能体之间进行交接。
memento-flashcards间隔重复闪卡系统。可根据事实或文本创建卡片,通过智能体评分的自由文本回答与闪卡进行对话,根据 YouTube 字幕生成测验,通过自适应调度复习到期的卡片,以及进行导入/导出……
shop-appShop.app:商品搜索、订单追踪、退货、重新下单。
shopify通过 curl 调用 Shopify 管理后台(Admin)与在线商店(Storefront)的 GraphQL API。管理商品、订单、客户、库存、元字段(metafields)。
siyuan思源笔记(SiYuan Note)API:通过 curl 在自托管的知识库中搜索、阅读、创建和管理区块(blocks)与文档。
telephony在不改变核心工具的前提下赋予 Hermes 电话功能。配置并持久化一个 Twilio 号码,发送和接收短信/彩信(SMS/MMS),拨打直接电话,并通过 Bland.ai 或 Vapi 拨打 AI 驱动的外呼电话。
技能(Skill)描述(Description)
bioinformatics接入来自 bioSkills 和 ClawBio 的 400 多项生物信息学技能。涵盖基因组学、转录组学、单细胞分析、变异调用、药物基因组学、宏基因组学、结构生物学等领域。获取特定领域的参考资料……
domain-intel使用 Python 标准库进行被动域名侦察。包含子域名发现、SSL 证书检查、WHOIS 查询、DNS 记录、域名可用性检查以及大批量多域名分析。无需 API 密钥。
drug-discovery用于药物研发工作流的制药研究助手。在 ChEMBL 上搜索生物活性化合物,计算类药性(林匹斯基五规则 Lipinski Ro5、QED、TPSA、合成可得性),通过 OpenFDA 查询药物相互作用,解读 ADMET……
duckduckgo-search通过 DuckDuckGo 进行免费网页搜索 —— 包含文本、新闻、图片、视频。无需 API 密钥。安装后优先使用 ddgs 命令行工具;仅在验证当前运行环境中提供 ddgs 后才使用 Python DDGS 库。
gitnexus-explorer使用 GitNexus 为代码库建立索引,并通过 Web 界面 + Cloudflare 隧道提供交互式知识图谱。
parallel-cli适用于 Parallel CLI 的可选厂商技能 —— 智能体原生的网页搜索、信息提取、深度研究、丰富化、FindAll(查找全部)以及监控。优先使用 JSON 输出和非交互式流程。
qmd使用 qmd 在本地搜索个人知识库、笔记、文档和会议纪要 —— 这是一个结合了 BM25、向量搜索和大语言模型重排(reranking)的混合检索引擎。支持命令行(CLI)和 MCP 集成。
scrapling使用 Scrapling 进行网络爬取 —— 通过命令行(CLI)和 Python 进行 HTTP 获取、隐身浏览器自动化、绕过 Cloudflare 以及蜘蛛爬虫。
searxng-search通过 SearXNG 进行免费元搜索 —— 聚合了 70 多个搜索引擎的结果。可自托管或使用公共实例。无需 API 密钥。在网页搜索工具集不可用时会自动降级使用。
技能(Skill)描述(Description)
1password设置和使用 1Password 命令行工具(op)。在安装该 CLI、启用桌面应用集成、登录以及为命令读取/注入机密信息时使用。
oss-forensics针对 GitHub 仓库的供应链调查、证据恢复和取证分析。涵盖已删除提交(commit)的恢复、强推(force-push)检测、失陷指标(IOC)提取、多源证据收集、假设形成与验证,以及……
sherlock跨越 400 多个社交网络的开源情报(OSINT)用户名搜索。通过用户名追踪社交媒体账号。
技能(Skill)描述(Description)
rest-graphql-debug调试 REST/GraphQL API:分析状态码、身份验证、Schema 规范以及问题复现。
技能(Skill)描述(Description)
page-agent将阿里巴巴的 page-agent 嵌入到您自己的 Web 应用程序中 —— 这是一个纯 JavaScript 的页内 GUI 智能体,以单个 <script> 标签或 npm 包的形式提供,让您网站的最终用户能够通过自然语言来驱动界面(例如“点击登录,填写用户名……”)。

贡献可选技能(Contributing Optional Skills)

Section titled “贡献可选技能(Contributing Optional Skills)”

若要向仓库中添加新的可选技能:

  1. optional-skills/<category>/<skill-name>/ 下创建一个目录
  2. 添加一个带有标准前置元数据(name、description、version、author)的 SKILL.md 文件
  3. references/templates/scripts/ 子目录中包含任何配套支持文件
  4. 提交拉取请求(PR) —— 一旦合并,该技能将出现在此目录中并获得其专属的文档页面
-
0:000:00