Hermes Agent 的核心能力来源于**技能(Skills)**系统。每个技能是一个 markdown 文件,定义了特定场景下的行为、工作流和注意事项。

技能系统概览

技能文件存储在 ~/.hermes/skills/ 下,按类别组织:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
skills/
├── academic/ # 学术写作
├── apple/ # Apple 生态(iMessage, 提醒事项)
├── autonomous-ai-agents/ # AI 智能体
│ ├── hermes-agent/ # Hermes 自身配置
│ ├── claude-code/ # Claude Code 集成
│ ├── codex/ # OpenAI Codex
│ ├── karpathy-guidelines/ # Karpathy 编码准则
│ └── ...
├── creative/ # 创意内容(ASCII 艺术、漫画、P5.js)
├── engineering/ # 工程开发
├── marketing/ # 营销推广
├── devops/ # DevOps 运维
├── mcp/ # MCP 协议
│ ├── native-mcp/ # 原生 MCP 客户端
│ └── midscene-browser/ # 浏览器自动化
├── github/ # GitHub 工作流
├── testing/ # 软件测试
└── ...

总计 320+ 技能,覆盖 55 个类别

加载技能

技能会自动匹配任务场景,也可以手动加载:

1
2
3
4
5
# 在 Hermes 中手动加载
/skill <技能名>

# 在提示词中引用
请加载 karpathy-guidelines 技能后回答

常用三方技能

0. 日常高频技能

以下是我日常工作中最常用的技能,按场景分类:

设计与创意

技能 用途
ui-ux-pro-max 移动端电商/应用 UI 设计,完整的组件规范和像素级页面设计
brainstorming 创意构思,生成产品设计和解决方案的多种可能
excalidraw 手绘风格架构图、流程图、时序图
architecture-diagram 深色主题 SVG 架构/云/基础设施图

全栈开发

技能 用途
reasonix 默认编码委托 — DeepSeek 原生框架,成本比 Claude 省 97%
claude-code 编码委托备选(需要 Claude 特定功能时)
codex 编码委托
opencode 编码委托
engineering-senior-developer Laravel/Livewire/FluxUI 全栈开发,高端 CSS、Three.js
engineering-frontend-developer Vue3/React 前端开发,UI 实现与性能优化
engineering-backend-architect FastAPI/后端架构设计、数据库、API 开发
engineering-code-reviewer 代码审查,关注正确性、可维护性、安全性

项目管理与规划

技能 用途
writing-plans 编写实施方案,分解为可执行步骤
project-manager-senior 需求拆分、任务分解、经验复盘
spike 快速验证想法的实验性原型
test-driven-development TDD 模式:RED → GREEN → REFACTOR

调试与问题排查

技能 用途
systematic-debugging 系统性调试:理解问题后再修复,而非盲目尝试
python-debugpy Python 远程调试(pdb + debugpy DAP)
node-inspect-debugger Node.js 远程调试(Chrome DevTools Protocol)

部署与运维

技能 用途
yisugou-deployment 易速购一键部署脚本(git clone + bash deploy.sh
yisugou-mvp-workflow 易速购 MVP 开发流程:后端模块 → 管理后台 → 数据入库 → 端到端测试
hexo-ci-cd Hexo 博客 GitHub Actions CI/CD 构建与部署
nginx-layered-proxy 双层 Nginx 架构(统一入口 + Docker 内部)
mysql-operations MySQL Docker 管理、密码重置、数据迁移、端口冲突处理
dockerfile-patterns Dockerfile 构建优化(上下文裁剪、层缓存、apt 镜像)

浏览器与自动化测试

技能 用途
midscene-browser 基于 MCP 的浏览器自动化,自然语言控制浏览器
testing-api-tester API 全面验证、性能测试、质量保证

1. Karpathy Guidelines

来源:multica-ai/andrej-karpathy-skills

著名的 AI 编码行为准则,包含 4 条核心原则:

  1. Think Before Coding — 显式陈述假设,不默默选择
  2. Simplicity First — 只写最少代码,不过度抽象
  3. Surgical Changes — 只改必须改的行,不顺手重构
  4. Goal-Driven Execution — 先定义成功标准再执行

2. Claude Code / Codex 集成

Hermes 可以委派编码任务给专用编码 Agent:

技能 用途 说明
claude-code 编码委托 用 Claude Code CLI 处理复杂编码任务
codex 编码委托 用 OpenAI Codex CLI 处理编码任务
opencode 编码委托 用 OpenCode CLI 处理编码任务

3. 浏览器自动化 (Midscene.js)

基于 MCP 协议的浏览器自动化工具,用自然语言控制浏览器:

1
2
3
4
5
6
# config.yaml MCP 配置
mcp_servers:
midscene-web:
command: npx
args:
- '@midscene/web-bridge-mcp'

用于:网页测试、表单填写、数据抓取、功能验证。

4. Agency Agents — Claude Code 人格库

来源:msitarzewski/agency-agents

184 个预定义的 AI Agent 人格,安装到 ~/.claude/agents/,在 Claude Code 中用 @agent-name 调用:

分类 Agent 数 示例
Engineering 18 @frontend-developer, @backend-architect, @code-reviewer
Design 8 @ui-designer, @ux-architect, @brand-guardian
Marketing 30+ @seo-specialist, @content-creator, @growth-hacker
Product 5 @product-manager, @sprint-prioritizer
Sales 8 @deal-strategist, @sales-engineer
Finance 8 @financial-analyst, @tax-strategist
Specialized 30+ @mcp-builder, @prompt-engineer, @workflow-architect

安装方式:

1
2
3
4
git clone --depth 1 https://github.com/msitarzewski/agency-agents.git /tmp/agency-agents
cd /tmp/agency-agents
bash scripts/install.sh --tool claude-code --no-interactive
rm -rf /tmp/agency-agents

5. Reasonix — DeepSeek 原生编码框架

Reasonix 是基于 DeepSeek 原生 API 的编码智能体框架,特点和优势:

特性 说明
版本 v0.50.1
模型 deepseek-v4-flash / deepseek-v4-pro
缓存 主动缓存优化(前缀共享 + 会话持久化)
成本 比 Claude Code 节省约 97%

命令速查:

命令 用途
reasonix run "任务" 非交互模式,单次任务
reasonix code 交互模式,带缓存/成本实时面板
reasonix stats 查看缓存命中率和成本统计
reasonix doctor 检查环境配置

与 Claude Code 的成本对比:

场景 Claude Code → DeepSeek Reasonix (原生)
单次调用 ~$0.009 ~$0.00027
缓存策略 服务端决定 主动前缀共享 + 会话持久化
交互模式 claude reasonix code

6. Apple 生态集成

技能 功能
imessage 发送/接收 iMessage 和 SMS
apple-reminders 管理 Apple 提醒事项
apple-notes 管理 Apple 备忘录
findmy 追踪 Apple 设备位置

7. MCP(Model Context Protocol)

原生 MCP 客户端支持,可连接任意 MCP 服务器动态注册工具。当前配置了:

  • codegraph — 代码图谱分析
  • midscene-web — 浏览器自动化

安装三方技能

从 GitHub 仓库安装技能:

1
2
# 克隆仓库到 skills 目录
git clone <repo-url> ~/.hermes/skills/<category>/<skill-name>

安装后重启 Hermes 即可使用。也可以使用 hermes install 命令(如果支持)。

插件系统

除了技能,Hermes 还支持插件机制。当前安装的插件:

  • hermes-achievements — 成就系统

参考:Hermes Agent 技能文档