Agentic Software Development

软件开发正发生在我们眼前的复兴。

如果你最近没用过这些工具，你可能低估了你所错过的东西。自 12 月以来，Codex 等工具的能力发生了阶跃式提升。昨天 OpenAI 的一些优秀工程师告诉我，他们的工作自 12 月以来发生了根本性的变化。在那之前，他们只能用 Codex 编写单元测试；而现在，它基本上编写了所有代码，并承担了大量的运维和调试工作。并非所有人都迈出了这一步，但这通常是因为模型能力之外的因素。

现在每家公司都面临着同样的机遇，而要驾驭好这一机遇——就像对待云计算或互联网一样——需要深思熟虑。这篇文章分享了 OpenAI 目前如何引导我们的团队向“智能体化软件开发”转型。我们仍在学习和迭代，但以下是我们目前的思考：

作为第一步，我们的目标是在 3 月 31 日前实现：

3 月 31 日目标

(1) 对于任何技术任务，人类的首选工具是与 Agent 交互，而不是使用编辑器或终端。

(2) 人类使用智能体的默认方式被明确评估为安全，且具有足够的生产力，使得大多数工作流不需要额外的权限。

为了实现这一目标，我们几周前向团队提出了以下建议：

花时间试用工具。工具本身就是最好的推销——许多人在几个月前放弃了 Codex 网页版，但在 Codex 5.2 中获得了惊人的体验。但许多人太忙了，还没机会尝试 Codex，或者陷入了纠结“它有没有办法做 X”，而不是直接尝试。
- 为你的团队指定一名“智能体负责人” (agents captain) —— 负责思考如何将智能体引入团队工作流的主要负责人。
- 在指定的内部频道分享经验或问题。
- 抽出一天时间举办公司范围内的 Codex 黑客松。
创建技能和 AGENTS.md。
- 为你参与的任何项目创建并维护 AGENTSMD；每当智能体出错或在任务中挣扎时，更新 AGENTSMD。
- 为你让 Codex 做的任何事情编写“技能” (skills)，并将其提交到共享仓库的技能目录中。
盘点并开放内部工具。
- 维护一份团队依赖的工具列表，并确保有人负责使其可被智能体访问（例如通过 CLI 或 MCP 服务器）。
构建“智能体优先”的代码库。随着模型更迭如此之快，这在某种程度上仍是处女地，需要一些探索。
- 编写运行速度快的测试，并在组件之间创建高质量的接口。
拒绝垃圾代码 (Say no to slop)。在大规模管理 AI 生成的代码是一个新兴问题，需要新的流程和规范来保持高代码质量。
- 确保有人对任何合并的代码负责。作为代码审查者，至少要保持与审查人类代码相同的标准，并确保作者理解他们提交的内容。
完善基础架构。每个人都有很大的空间来构建基础架构，这可以由内部用户反馈来引导。核心工具正变得越来越好用，但目前工具周围还有很多配套设施，例如可观测性、不仅跟踪提交的代码还要跟踪导致这些代码的智能体轨迹 (agent trajectories)，以及对智能体可用工具的集中管理。

总的来说，采用 Codex 这样的工具不仅是技术变革，也是深刻的文化变革，还有许多下游影响需要解决。我们鼓励每位管理者带领团队推进这一进程，并思考其他行动项 —— 例如，针对上述第 5 点，还有什么能防止大量“功能正确但难以维护的代码”潜入代码库。

wwsun

探索

Agentic Software Development

关系图谱

最近更新

Agent Skills 构建指南

《持续买入》读书笔记

《学会提问》读书笔记

10 个 NotebookLM 专家级高质量提示词

Build Any App: The Technical Co-Founder