Skills For Real Engineers

快速开始

运行 skills.sh 安装器：

npx skills@latest add mattpocock/skills

选择你想要的技能，以及要安装到哪些编程 Agent 上。确保选中 /setup-matt-pocock-skills。
在 Agent 中运行 /setup-matt-pocock-skills。它会：
- 询问你想使用哪个 Issue Tracker（GitHub、Linear 或本地文件）
- 询问你在 triage issue 时使用的标签（/triage 会用到这些标签）
- 询问你想把生成的文档保存在哪里
搞定——可以开始使用了。

这些技能为何存在

我构建这些技能是为了修正在 Claude Code、Codex 和其他编程 Agent 中常见的失败模式。

1：Agent 做出的东西不是我想要的

“没有人确切知道自己想要什么。”

—— David Thomas & Andrew Hunt，《程序员修炼之道》

问题。软件开发中最常见的失败模式是对齐偏差。你以为开发者知道你想要什么。然后你看到他们构建的东西——意识到他们根本没有理解你的意思。

这在 AI 时代完全一样。你和 Agent 之间存在沟通鸿沟。解决方案是深度质询（grilling session）——让 Agent 就你正在构建的东西向你提出详尽的问题。

解决方案是使用：

/grill-me — 用于非代码场景
/grill-with-docs — 与 /grill-me 相同，但增加了更多好东西（见下文）

这些是我最受欢迎的技能。它们帮助你在开始之前与 Agent 对齐，并深度思考你所做的变更。每次你想要做出变更时都使用它们。

2：Agent 的输出太啰嗦了

有了统一语言，开发者之间的对话和代码的表达都源自同一个领域模型。

—— Eric Evans，《领域驱动设计》

问题：在项目开始时，开发者和他们为之构建软件的人（领域专家）通常说着不同的语言。

我在 Agent 身上感受到了同样的张力。Agent 通常被丢进一个项目中，被要求边做边摸索行话。于是他们用 20 个词来表达 1 个词就能说清的东西。

解决方案是一种共享语言。它是一个帮助 Agent 解码项目中行话的文档。

示例

这是来自我的 course-video-manager 仓库的一个 CONTEXT.md 示例。哪个更容易阅读？

之前：“课程中某个 section 下的 lesson 被 ‘具现化’（即在文件系统中分配位置）时会出现问题”

之后：“materialization cascade 出现了问题”

这种精炼在一次又一次的 session 中持续发挥价值。

这已内置于 /grill-with-docs 中。它是一个质询过程，但能帮助你在与 AI 构建共享语言的同时，将难以解释的决策记录在 ADR 中。

很难说清楚这有多强大。它可能是这个仓库中最酷的一项技术。试试看就知道了。

Tip

共享语言除了减少啰嗦还有许多其他好处：

变量、函数和文件使用共享语言统一命名

结果是，代码库对 Agent 来说更容易导航

Agent 也花费更少的 token 在思考上，因为它能使用更精炼的语言

3：代码不能正常工作

“始终采取小而审慎的步骤。反馈的速度就是你的速度上限。永远不要接手太大的任务。”

—— David Thomas & Andrew Hunt，《程序员修炼之道》

问题：假设你和 Agent 就构建什么已经对齐了。但如果 Agent 还是产出垃圾代码呢？

这时候就需要审视你的反馈闭环了。如果没有关于 Agent 产出的代码实际运行情况的反馈，Agent 就是在盲飞。

解决方案：你需要常规的反馈闭环工具箱：静态类型、浏览器访问和自动化测试。

对于自动化测试，红-绿-重构循环至关重要。这意味着 Agent 先写一个失败的测试，然后修复代码使其通过。这为 Agent 提供了一致的反馈水平，从而产出好得多的代码。

我构建了一个 /tdd 技能，可以嵌入任何项目。它鼓励红-绿-重构，并为 Agent 提供了大量关于好测试和坏测试的指导。

对于调试，我还构建了一个 /diagnosing-bugs 技能，将最佳调试实践包装成一个简单的循环。

4：我们构建了一团烂泥

“每天都要投资于系统的设计。”

—— Kent Beck，《解析极限编程》

“最好的模块是深的。它们允许通过一个简单的接口访问大量功能。”

—— John Ousterhout，《软件设计的哲学》

问题：用 Agent 构建的大多数应用都复杂且难以修改。因为 Agent 可以极大地加速编码，它们也加速了软件熵增。代码库以前所未有的速度变得越来越复杂。

解决方案是一种全新的 AI 驱动开发方法：关注代码的设计。

这内置于这些技能的每一层：

/to-prd 在创建 PRD 之前会询问你正在触及哪些模块

更为关键的是，/improve-codebase-architecture 帮助你拯救已经变成烂泥的代码库。我建议每隔几天对你的代码库运行一次。

总结

软件工程基本功比以往任何时候都更重要。这些技能是我将这些基本功浓缩为可重复实践的最佳努力，旨在帮助你交付职业生涯中最好的应用。享受吧。

核心技能深度分析

`/grill-with-docs` — 质询 + 文档化

最值得采用的技能

Agent 逐轮质询你的计划，每次只问一个问题，同时将决策沉淀为 ADR + 术语表。这是解决「Agent 做的不是你想要的」这一核心痛点的系统性方案。

工作流程：

用户描述需求 → Agent 不急于实现，逐轮追问
每轮追问探索决策树的一个分支，每次一个问题
关键术语自动写入 CONTEXT.md
重要决策写入 docs/adr/NNNN.md
质询结束 → 双方完全对齐

底层引擎：/grilling（model-invoked）+ /domain-modeling（model-invoked）

`/tdd` — 测试驱动开发

核心理念：

测试验证行为（通过公开接口），不验证实现细节
一个测试 → 一个实现 → 重复（禁止水平切片）
仅在系统边界 mock（外部 API、时间、文件系统）
优先集成测试，其次单元测试

水平切片 vs 垂直切片：

❌ WRONG（水平切片）:
  RED:   test1, test2, test3, test4, test5
  GREEN: impl1, impl2, impl3, impl4, impl5

✅ RIGHT（垂直切片）:
  RED→GREEN: test1→impl1
  RED→GREEN: test2→impl2
  RED→GREEN: test3→impl3

水平切片陷阱

批量写测试 → 批量写实现会产出「垃圾测试」——测试的是想象中而非实际的行为，对真实变更不敏感。

`/diagnosing-bugs` — 结构化诊断

6 个阶段，但 Phase 1（构建反馈闭环）是全部：

如果你有一个紧凑的通过/失败信号——一个针对此 bug 变红的信号——你就能找到原因。二分查找、假设检验、插桩都只是消费它。如果没有，盯着代码看也没用。

10 种反馈闭环构建方法（优先级降序）：

失败测试
Curl/HTTP 脚本
CLI 调用 + 快照对比
Headless 浏览器脚本
网络请求回放
最小化测试夹具
模糊测试循环
Git bisect 自动化
版本间差异对比
人工参与脚本（最后手段）

Phase 3 的关键创新：生成 3-5 个可证伪假设，先给用户看排序再验证——用户往往有领域知识能立即重排序。

`/to-issues` — PRD → 垂直切片

将 PRD 拆分为独立可完成的垂直切片：

❌ 水平切片:                 ✅ 垂直切片:
  Issue #1: DB schema          Issue #1: 用户可查看列表（schema+API+UI）
  Issue #2: API 层              Issue #2: 用户可创建新项
  Issue #3: UI 层               Issue #3: 用户可编辑配置

每个切片贯穿所有系统层，单独可演示/可验证，天然适合「开新 session 让 Agent 独立实现」的并行开发模式。

`/domain-modeling` & `/codebase-design` — 设计词汇表

这个设计模式极具参考价值

Matt 将设计方法论本身编码为 model-invoked 技能。/codebase-design 不是告诉 Agent 怎么做设计，而是给 Agent 一套精确词汇（Module / Interface / Depth / Seam / Adapter / Leverage / Locality），其他技能引用这套词汇来沟通设计。

深度模块概念：

深度模块 = 小接口 + 大实现
  → 高 Leverage（一个实现服务 N 个调用者）
  → 高 Locality（修改/调试集中在一处）

浅模块 = 大接口 + 小实现
  → 低 Leverage（每个调用者都要理解复杂接口）
  → 低 Locality（改动散落各处）

`/prototype` — 抛掉式原型

6 条铁律确保原型不会腐化为生产代码：

从第一天标记为 throwaway——命名即可见
一条命令可运行——零摩擦启动
默认无持久化——状态在内存
跳过所有工程化——没测试、没错误处理、没抽象
每次操作渲染完整状态——可视化所有变更
问题解决后删除或吸收——不留腐烂代码

参考

这些技能沿一个维度划分——谁可以调用它们。用户调用（User-invoked） 技能只能在你手动输入时触发（如 /grill-me）；它们的职责是编排。模型调用（Model-invoked） 技能可以由你调用，也可以由 Agent 在任务匹配时自动触发；它们承载着可复用的纪律。用户调用技能可以调用模型调用技能，但不能调用另一个用户调用技能。

工程（Engineering）

我日常编码使用的技能。

用户调用

ask-matt — 询问哪种技能或流程适合你的场景。本仓库中用户调用技能的路由器。
grill-with-docs — 质询过程，同时构建项目的领域模型，在过程中磨砺术语并更新 CONTEXT.md 和 ADR。
triage — 将 Issue 按 Triage 角色状态机流转。
improve-codebase-architecture — 扫描代码库寻找深化机会，以可视化 HTML 报告呈现，然后对你选择的候选项进行质询。
setup-matt-pocock-skills — 为工程技能配置当前仓库（Issue Tracker、Triage 标签、领域文档布局）。在使用其他工程技能之前，每个仓库运行一次。
to-issues — 将任何计划、spec 或 PRD 使用垂直切片拆分为可独立接手的 Issue。
to-prd — 将当前对话转化为 PRD 并发布到 Issue Tracker。无需面谈——仅合成你已讨论过的内容。
prototype — 构建抛掉式原型来充实设计——可以是一个用于状态/业务逻辑问题的可运行终端应用，也可以是一个路由上可切换的多种截然不同的 UI 变体。

模型调用

diagnosing-bugs — 针对棘手 Bug 和性能回归的结构化诊断循环：复现 → 最小化 → 假设 → 插桩 → 修复 → 回归测试。
tdd — 红-绿-重构循环的测试驱动开发。一次一个垂直切片地构建功能或修复 Bug。
domain-modeling — 主动构建和磨砺项目的领域模型——用术语表挑战术语，用边界场景进行压力测试，并在过程中更新 CONTEXT.md 和 ADR。
codebase-design — 设计深度模块的共享纪律和词汇：大量行为隐藏在小接口之后，置于干净的 seam，可通过该接口测试。

生产力（Productivity）

通用工作流工具，不限于编码。

用户调用

grill-me — 被 relentlessly 地盘问你的计划或设计，直到决策树的每个分支都被解决。
handoff — 将当前对话压缩成交班文档，以便另一个 Agent 可以继续工作。
teach — 在多个 session 中向你教授一项新技能或概念，使用当前目录作为有状态的教学工作区。
writing-great-skills — 编写和编辑优秀技能的参考指南：使技能可预测的词汇和原则。

模型调用

grilling — relentlessly 地盘问用户关于计划或设计的每一个方面，直到决策树的每个分支都被解决。位于 grill-me 和 grill-with-docs 之后的可复用循环。

杂项（Misc）

我保留但很少使用的工具。

git-guardrails-claude-code — 设置 Claude Code hooks 以在执行前拦截危险的 git 命令（push、reset —hard、clean 等）。
migrate-to-shoehorn — 将测试文件中的 as 类型断言迁移到 @total-typescript/shoehorn。
scaffold-exercises — 创建包含 section、problem、solution 和 explainer 的练习目录结构。
setup-pre-commit — 设置 Husky pre-commit hooks，包含 lint-staged、Prettier、类型检查和测试。

wwsun

探索