I got a private lesson on Claude Cowork & Claude Code

内容概要

Greg Isenberg 邀请了 Claude Code 的创始人 Boris,深入探讨 Anthropic 的最新工具:Claude Co-work 和 Claude Code。Boris 展示了这些智能体 AI (Agentic AI) 系统如何超越简单的聊天功能,直接与本地文件交互、控制浏览器以自动化处理报销和邮件任务,并利用“技能 (Skills)”扩展处理复杂软件的能力。讨论涵盖了从终端工具向用户友好型界面的转型、AI 安全与删除保护的重要性,以及 Boris 个人的生产力秘诀——包括并行运行多个智能体,并利用 Opus 4.5 的思考能力来彻底消除手动编码。

Claude Co-work 简介

Greg Isenberg: Claude Co-work 已经发布了。如果你能掌握它的用法,你将能够超越这个星球上 99% 的人。这是一种让你使用 Claude Code 的简便方式。你可能听说过 Claude Code,它最近在网络上疯传,但问题是它太偏技术化了。你必须在终端 (Terminal) 中操作,这对很多初学者来说并不友好。

所以 Claude 推出了 Co-work。这是一个全新的产品,它在简单的 UI 界面中发挥了 Claude Code 的强大功能,任何人都能轻松上手。无论你的父母还是你自己,都能通过它获得极大的助力。

在这一集中,我请来了该产品的负责人 Boris。我非常激动能让他来展示使用 Claude Co-work 的最佳实践,并在最后分享他如何配置自己的 Claude Code 以发挥最大功效。你会喜欢这一集的。

Claude Code 的应用场景与发展历程

Greg Isenberg: 我们很幸运能请到 Boris,他是 Claude Code 的创始人,也可以说是今天 Claude Co-work 的共同开发者。我希望通过今天的交流,让大家更好地理解 Co-work 的应用场景、如何入门,以及一些意想不到的使用方法。Boris,感谢你来到节目,我想先问一个问题:在这一集结束时,听众能有什么收获?

Boris: 大家好。我认为大家会获得更多关于如何使用 Co-work 的灵感,或许还会发推文分享,甚至联系我,让我了解大家希望如何使用它。

很有趣的是,Claude Code 从一开始并不是为了做成一个产品。最初我们认为大家会用它来写代码,但很快我们发现,人们不仅仅用它写代码,还用它处理各种事务。Claude Code 的发展历程充满了惊喜,通过观察用户如何使用甚至“滥用”这个产品,我学到了很多。

对于 Co-work,我也有同样的感觉。我有一些关于用途的假设,但我认为当它真正投入到实际应用中时,结果会非常出人意料。

Greg Isenberg: 平台类的产品往往都是这样,特别是当你考虑到 App Store 刚出现时,最初的应用只是一些模拟喝啤酒的简单程序。开发者当时肯定预料不到会出现 Uber、Door Dash 或 TikTok。我们现在正处于探索阶段,包括创始人在内的所有人都没有标准答案。

现场演示:文件整理与收据处理

Boris: 没错,让我们直接看演示。这是 Claude 的桌面应用程序。你可以直接下载,目前 Co-work 仅支持 Mac OS,Windows 版本即将推出。桌面端有几个不同的标签页:默认的聊天 (Chat) 标签、新的 Co-work 标签以及用于代码的 Code 标签。

Co-work 的底层其实就是 Claude Code。让 Claude Code 如此出色的智能体 (Agent),我们称之为 Claude Agent。它也以 SDK 的形式提供,所以公司可以基于它构建各种酷炫的功能。我们在 Co-work 中直接使用了这个相同的 SDK。

当我们谈论“智能体 AI (Agentic AI)”时,这个词有时会被滥用。很多人听过“智能体”,但并不知道它到底意味着什么。在 AI 领域,它有一个非常明确的定义。

与大家熟悉的聊天机器人不同,智能体最大的区别在于它可以采取行动 (Take action)。它不仅是文本输出或网页搜索,它可以实际使用你电脑上的工具,与现实世界互动。Anthropic 从一开始就致力于此,我们希望模型在编码、工具调用 (Tool use) 以及计算机使用 (Computer use) 方面表现卓越。

对于用过 Claude Code 的人来说,接下来的内容可能并不意外。我们正在努力让这些功能安全地普及给每一个人。

现在,我的桌面上有一个“收据 (Receipts)”文件夹,里面有一些文件。我将授权 Co-work 访问我的桌面。你必须手动选择它可以查看的特定文件夹,默认情况下它无法访问任何内容。

我现在对它说:“我有一个收据文件夹,你能根据收据上的日期重命名这些文件吗?”

Greg Isenberg: 使用 Co-work 时,它是在直接操作你的文件。这对很多人来说是一个重大的思维转变,它几乎就像你的操作系统 (OS),对吗?

Boris: 没错,它能处理你授权给它的文件。更酷的是它可以使用各种工具。它能为你生成文件,比如演示文稿;它能通过 MCP 协议 (Model Context Protocol) 与任何工具交互;它还内置了对 Chrome 浏览器的支持,可以控制浏览器来执行任务。

当你刚开始使用 Co-work 时,我建议从挂载一个文件夹开始,让它帮你清理和整理文件。

在这里,它找到了我那四个收据文件。它发现其中一个收据缺少日期,所以问我是否只重命名其他的。我会告诉它:“对于缺日期的那个,由你决定;或者干脆不要重命名它。”

这种互动在 AI 领域被称为“反向引导 (Reverse elicitation)”。当模型不确定时,它会请求澄清,而不是盲目假设。现在我们可以看到,它已经重命名了这些收据,整理得井井有条。

AI 安全与系统集成

Boris: 接下来我们可以试着把这些数据放入电子表格。

Greg Isenberg: 所以它实际上是在接管你的电脑,对吧?如果你允许的话。

Boris: 是的。我们在安全方面做了大量工作,确保它不会让你误删文件。Anthropic 本质上是一家 AI 安全实验室,这是我们存在的基石。

我们从模型层面上进行“模型对齐 (Model alignment)”和“机制可解释性 (Mechanistic interpretability)”研究,甚至像研究人类神经元一样研究模型的神经元。此外,我们在底层运行了一个虚拟机 (Virtual Machine),以确保任何操作都在沙箱中运行。

上周我们还增加了“删除保护 (Deletion protection)”。如果模型尝试删除文件,系统会先提示你确认。在与互联网交互时,我们还针对“提示词注入 (Prompt injection)”构建了多重保护措施。虽然它还不完美,但这也是我们提早发布产品的原因,我们需要观察它在真实世界中的表现。

浏览器自动化与 Google 表格

Boris: 现在我问它:“能把这些数据做成 Google 表格 (Google Sheets) 吗?”

Greg Isenberg: 这是一个很有趣的点。很多人在使用工具时会卡住,因为它的可能性太多了。把它做成 Google 表格这种要求非常自然。你可以真的把它当成一个队友。

Boris: 没错。你看,它现在正在打开浏览器。它会向我请求权限,我选择“始终允许”。现在 Claude 开始接管了,它正在为我创建一个电子表格。

目前的“计算机使用”功能可能还需要一点时间。我记得我刚加入 Anthropic 时,当我们的模型第一次展示出能使用电脑的能力时,一名研究员兴奋地跑进房间喊道:“我的天,Claude 知道怎么用电脑了!”

当时它花了一个小时才成功订到一份披萨,因为它点击操作很慢。但从那以后,我们一直在优化它的速度。现在你可以看到 Claude 正在输入并与电子表格交互,它能看清屏幕上的内容并进行操作。

生产力与多任务并行

Greg Isenberg: 它能处理邮件吗?比如把这个表格发给财务团队。

Boris: 当然可以。我们先让它把表格格式调好,然后再发送。你会发现它在操作过程中有时会犯错,比如刚才粘贴数据时格式不对,但它立刻意识到了,并正在尝试修正。

这种通用性非常惊人。正如你之前说的,就像有了 GPS 的手机注定会催生 Uber 一样,我们现在正处于智能体时代的起点。

Greg Isenberg: 没错。我在想,如果我能审计我公司的所有流程,看看员工如何处理文件、如何使用互联网、如何发送信息,我该如何利用这些机会提高团队和个人的效率。

Boris: 这正是正确的思考方式。顺便说一下,当这个任务正在运行时,我可以开启一个新任务去做别的事情,比如让它搜集一些播客节目的灵感。

我可以让多个任务并行运行。你可以把所有乏味的事务性工作都交给 Co-work。过去一年,工程师们已经开始用 Claude Code 自动化枯燥的编码任务了,现在这种能力正普及到每个人。

对我来说,作为一名工程师,这是最有趣的阶段。我能专注于我享受的部分,而把所有不愿做的繁杂琐事都交给 Claude。

自动化沟通:Gmail 与 Slack

Boris: 好的,现在表格做好了。虽然还有点小瑕疵,但数据是正确的。现在我要测试它能不能发邮件。我对它说:“能打开 Gmail 把这个表格发给 Amy 吗?”

Greg Isenberg: 它怎么知道谁是 Amy?它会直接在 Gmail 的联系人里搜索吗?

Boris: 没错,它的操作方式和人类一样。它会看屏幕,点击“写邮件”,然后在收件人栏输入 Amy。

我知道 YouTube 评论区里肯定会有人说:“这太慢了,我自己做会更快。”

确实,目前某些操作我亲自动手会更快。但在 Claude Code 早期也是这样。随着模型变得更聪明,它的速度会显著提升。更重要的是,因为你可以并行处理任务,你实际上节省了大量时间。我的工作流是同时开启好几个任务,然后像管理员一样在不同的 Claude 任务之间切换,确保它们没有被难住。

现在你看,邮件草稿已经存好了。我也可以用它来处理 Slack。比如我们每周有一个追踪团队工作进度的表格,以前我得一个个催促工程师填写状态,现在我直接让 Co-work 去看表格,发现没填写的直接在 Slack 上私信那个工程师。我下达完指令就可以去喝咖啡了。

采用现状:从终端到图形界面

Greg Isenberg: 你认为 Co-work 会成为 Claude Code 的“入门工具”吗?对于非技术人员来说,终端确实让人望而生畏,但现在这个 UI 界面感觉非常亲切。

==Boris: 是的。Claude Code 最初是为终端设计的,我当时以为只有硬核工程师才会用。但我惊讶地发现,Anthropic 的销售团队、产品经理、设计师甚至数据科学家每天都在用终端版的 Claude Code。==

虽然他们学会了用终端,但我猜他们更倾向于这种不需要处理 Bash 命令的图形化界面。

利用技能与数字队友实现规模化

Greg Isenberg: 我梦想的是一种自动化:每当 A 发生时,我就让你去做 B。

Boris: 这是一个很酷的想法。这涉及到“技能 (Skills)”的概念。技能本质上是一种可重复的操作方式。比如刚才生成 Excel 时的操作,就是我们预先封装好的技能。

如果你有某些特殊的文件格式(如 AutoCAD)或特定的软件(如 Salesforce),你只需要创建一个技能,Claude 就能处理它。这意味着你通过前期的配置,可以让 Co-work 变得越来越强大。

自定义工作流

Greg Isenberg: 关于 Co-work 还有什么我们需要知道的吗?比如插件或配置。

Boris: 我们努力让 Co-work 保持简单。工程师喜欢折腾工具,所以 Claude Code 有极其复杂的配置系统,支持各种钩子 (Hooks) 和权限设置。

但对于 Co-work,我不建议过度自定义。安装桌面应用和 Chrome 插件就足够了。只有当你发现它在某些特定软件上表现不佳时,才需要考虑编写技能。

现在的 Co-work 很像一年前的 Claude Code。当时它还很简陋,甚至有点难用。但现在的 Co-work 已经非常实用了。它第一周的增长速度是 Claude Code 当时的好几倍。

2027 年智能体的未来

Greg Isenberg: 展望 2027 年 1 月,你认为人们会如何使用 Co-work?

Boris: 模型的进化速度是指数级的,人类的大脑很难预测这种增长。如果非要推测,一年前我和 Dario(Anthropic CEO)曾预测到去年年底人们将不再需要亲自动手写代码。

我现在每月提交两三百个合并请求 (PR),在过去的两个月里,100% 的代码都是 Claude Code 写的,我一行都没亲手写过。这在以前是无法想象的。

我认为在 2027 年,所有连接应用、整理数据的繁琐工作都将被模型承包。这听起来可能有点吓人,但也非常令人兴奋。人们可以从苦差事中解脱出来,每个人都能拥有一支 Claude 军队来为自己工作。

Boris 的个人 Claude Code 配置

Greg Isenberg: 你的那篇关于 Claude Code 配置的推文非常火。你说你的配置其实非常“原生 (Vanilla)”,并没有太多花哨的自定义。

Boris: 没错。在工作时,我通常在终端和移动端之间切换。我会同时开启 5 到 10 个 Claude 任务。

我会在一个标签页启动任务,在它思考规划时跳到第二个标签页。当我处理完一轮指令后,再回到第一个标签页检查它的规划。一旦规划通过,我就开启“自动接受编辑 (Auto-accept edits)”模式,因为在 Opus 4.5 时代,一旦规划正确,模型几乎可以完美执行。

我的工作现在就是不断在不同标签页之间跳转,确保这些“Claude”没有被卡住。

利用 Opus 4.5 和思考模式

Boris: 我始终坚持使用带思考能力的 Opus 4.5 处理一切任务。它是目前最好的编码模型。虽然它比 Sonnet 慢且贵,但因为它更聪明,需要的引导更少,最终消耗的 Token 往往更少,所以反而更便宜、更高效。这听起来有点反直觉,但事实确实如此。

协作工程与 Claude.md

Greg Isenberg: 你们团队共享一个 Claude.md 文件,这很有意思。

Boris: 是的,我们将它签入 Git 仓库,全员维护。每当 Claude 犯了错,我们就把正确的做法写进这个文件,这样它下次就不会再犯。

这个文件没有任何特殊格式,就是纯文本。我们还利用 GitHub Action 实现了“复合工程 (Compound Engineering)”。我们在代码评审 (Code Review) 时直接 @Claude 并在 PR 中让它修改代码或更新 Claude.md

原则是:任何问题不应该让它犯第二次。以前我在 Meta 工作时,会手动记录代码评审中的常见问题并编写 Lint 规则来自动化检查。现在,你只需要把这些写进 Claude.md ,它就是你团队的共享知识库。

验证输出与验证技巧

Boris: 最后一个提升性能的关键点是:给 Claude 一个验证输出的方法。

就像画家如果闭上眼睛就画不好画一样,如果模型写了代码但无法运行或无法看到运行效果,它就无法自我修正。我会利用 Chrome 插件让 Claude 亲自测试它写的网页。无论是运行测试脚本还是启动服务器,只要你能让它看到结果,它的产出质量就会有质的飞跃。

总结与法语发音争论

Greg Isenberg: 最终的建议就是亲自动手尝试。

Boris: 没错。Claude Code 就像一本“选择你自己的冒险”丛书,没有唯一的正确路径。

Greg Isenberg: 感谢你的分享。最后我想问个私人问题:我来自加拿大法语区,我一直把 Claude 读作“Clo”,我是唯一的异类吗?

Boris: 或许不是。今天回到办公室,我就试着叫它“Clo”,看看大家会有什么反应。

Greg Isenberg: 哈哈,期待你的反馈!