软件开发正发生在我们眼前的复兴。
如果你最近没用过这些工具,你可能低估了你所错过的东西。自 12 月以来,Codex 等工具的能力发生了阶跃式提升。昨天 OpenAI 的一些优秀工程师告诉我,他们的工作自 12 月以来发生了根本性的变化。在那之前,他们只能用 Codex 编写单元测试;而现在,它基本上编写了所有代码,并承担了大量的运维和调试工作。并非所有人都迈出了这一步,但这通常是因为模型能力之外的因素。
现在每家公司都面临着同样的机遇,而要驾驭好这一机遇——就像对待云计算或互联网一样——需要深思熟虑。这篇文章分享了 OpenAI 目前如何引导我们的团队向“智能体化软件开发”转型。我们仍在学习和迭代,但以下是我们目前的思考:
作为第一步,我们的目标是在 3 月 31 日前实现:
3 月 31 日目标
- (1) 对于任何技术任务,人类的首选工具是与 Agent 交互,而不是使用编辑器或终端。
- (2) 人类使用智能体的默认方式被明确评估为安全,且具有足够的生产力,使得大多数工作流不需要额外的权限。
为了实现这一目标,我们几周前向团队提出了以下建议:
-
花时间试用工具。工具本身就是最好的推销——许多人在几个月前放弃了 Codex 网页版,但在 Codex 5.2 中获得了惊人的体验。但许多人太忙了,还没机会尝试 Codex,或者陷入了纠结“它有没有办法做 X”,而不是直接尝试。
- 为你的团队指定一名“智能体负责人” (agents captain) —— 负责思考如何将智能体引入团队工作流的主要负责人。
- 在指定的内部频道分享经验或问题。
- 抽出一天时间举办公司范围内的 Codex 黑客松。
-
创建技能和 AGENTS.md。
-
盘点并开放内部工具。
- 维护一份团队依赖的工具列表,并确保有人负责使其可被智能体访问(例如通过 CLI 或 MCP 服务器)。
-
构建“智能体优先”的代码库。随着模型更迭如此之快,这在某种程度上仍是处女地,需要一些探索。
- 编写运行速度快的测试,并在组件之间创建高质量的接口。
-
拒绝垃圾代码 (Say no to slop)。在大规模管理 AI 生成的代码是一个新兴问题,需要新的流程和规范来保持高代码质量。
- 确保有人对任何合并的代码负责。作为代码审查者,至少要保持与审查人类代码相同的标准,并确保作者理解他们提交的内容。
-
完善基础架构。每个人都有很大的空间来构建基础架构,这可以由内部用户反馈来引导。核心工具正变得越来越好用,但目前工具周围还有很多配套设施,例如可观测性、不仅跟踪提交的代码还要跟踪导致这些代码的智能体轨迹 (agent trajectories),以及对智能体可用工具的集中管理。
总的来说,采用 Codex 这样的工具不仅是技术变革,也是深刻的文化变革,还有许多下游影响需要解决。我们鼓励每位管理者带领团队推进这一进程,并思考其他行动项 —— 例如,针对上述第 5 点,还有什么能防止大量“功能正确但难以维护的代码”潜入代码库。