软件开发正发生在我们眼前的复兴。

如果你最近没用过这些工具,你可能低估了你所错过的东西。自 12 月以来,Codex 等工具的能力发生了阶跃式提升。昨天 OpenAI 的一些优秀工程师告诉我,他们的工作自 12 月以来发生了根本性的变化。在那之前,他们只能用 Codex 编写单元测试;而现在,它基本上编写了所有代码,并承担了大量的运维和调试工作。并非所有人都迈出了这一步,但这通常是因为模型能力之外的因素。

现在每家公司都面临着同样的机遇,而要驾驭好这一机遇——就像对待云计算或互联网一样——需要深思熟虑。这篇文章分享了 OpenAI 目前如何引导我们的团队向“智能体化软件开发”转型。我们仍在学习和迭代,但以下是我们目前的思考:

作为第一步,我们的目标是在 3 月 31 日前实现:

3 月 31 日目标

  • (1) 对于任何技术任务,人类的首选工具是与 Agent 交互,而不是使用编辑器或终端。
  • (2) 人类使用智能体的默认方式被明确评估为安全,且具有足够的生产力,使得大多数工作流不需要额外的权限。

为了实现这一目标,我们几周前向团队提出了以下建议:

  1. 花时间试用工具。工具本身就是最好的推销——许多人在几个月前放弃了 Codex 网页版,但在 Codex 5.2 中获得了惊人的体验。但许多人太忙了,还没机会尝试 Codex,或者陷入了纠结“它有没有办法做 X”,而不是直接尝试。

    • 为你的团队指定一名“智能体负责人” (agents captain) —— 负责思考如何将智能体引入团队工作流的主要负责人。
    • 在指定的内部频道分享经验或问题。
    • 抽出一天时间举办公司范围内的 Codex 黑客松。
  2. 创建技能和 AGENTS.md

    • 为你参与的任何项目创建并维护 AGENTSMD;每当智能体出错或在任务中挣扎时,更新 AGENTSMD
    • 为你让 Codex 做的任何事情编写“技能” (skills),并将其提交到共享仓库的技能目录中。
  3. 盘点并开放内部工具

    • 维护一份团队依赖的工具列表,并确保有人负责使其可被智能体访问(例如通过 CLI 或 MCP 服务器)。
  4. 构建“智能体优先”的代码库。随着模型更迭如此之快,这在某种程度上仍是处女地,需要一些探索。

    • 编写运行速度快的测试,并在组件之间创建高质量的接口。
  5. 拒绝垃圾代码 (Say no to slop)。在大规模管理 AI 生成的代码是一个新兴问题,需要新的流程和规范来保持高代码质量。

    • 确保有人对任何合并的代码负责。作为代码审查者,至少要保持与审查人类代码相同的标准,并确保作者理解他们提交的内容。
  6. 完善基础架构。每个人都有很大的空间来构建基础架构,这可以由内部用户反馈来引导。核心工具正变得越来越好用,但目前工具周围还有很多配套设施,例如可观测性、不仅跟踪提交的代码还要跟踪导致这些代码的智能体轨迹 (agent trajectories),以及对智能体可用工具的集中管理。

总的来说,采用 Codex 这样的工具不仅是技术变革,也是深刻的文化变革,还有许多下游影响需要解决。我们鼓励每位管理者带领团队推进这一进程,并思考其他行动项 —— 例如,针对上述第 5 点,还有什么能防止大量“功能正确但难以维护的代码”潜入代码库。