智能体对话——AI真正开始工作的时刻
这是”与AI协作的3个层次”系列的第2篇文章。第1篇介绍了聊天——与AI对话的艺术。现在我们来探索当对话变成创造时会发生什么。
每个从建议型AI过渡到智能体AI的人,都会经历一个特殊的时刻。
你正在和Claude或ChatGPT讨论如何构建某个东西。你描述你的需求。AI用有帮助的建议、代码片段、分步说明来回应。你复制代码,粘贴到编辑器,运行。成功了。或者没成功。你回到聊天界面。继续迭代。
然后有人给你演示Claude Code、Cursor或GitHub Copilot的智能体模式。
“看好了,“他们说。他们描述想要构建的东西。AI不只是回复建议。它打开文件,搜索代码库,直接向多个文件写入代码,运行测试,发现错误并修复,将更改提交到git。
这次对话产出的不是建议,而是真实的产品。
这就是从聊天到智能体对话的转变。从”告诉我怎么做”到”帮我做好”。
工具的力量
区别不在于AI模型本身,而在于配套的工具体系。
你在claude.ai上和Claude聊天,使用的是与Claude Code相同的底层模型。区别在哪?Claude Code有工具:
- 文件搜索 — 在代码库中找到相关文件
- Read — 打开并分析文件内容
- Write — 创建新文件或覆盖现有文件
- Edit — 对特定行进行精确修改
- Bash — 执行命令、运行测试、使用git
- Grep — 跨文件搜索模式
这些工具将AI从顾问变成了执行者。它不再告诉你该怎么做,而是直接做这件事。
同样的模式在不同平台都存在:
| 平台 | 新增功能 | 结果 |
|---|---|---|
| ChatGPT | 仅对话 | 建议和代码片段 |
| Claude Code | 文件工具 + Shell访问 | 构建真实项目 |
| GitHub Copilot | IDE集成 | 边工作边写代码 |
| Cursor | 代码库感知 | 多文件编辑 |
| Gemini CLI | 终端 + 文件访问 | 从命令行执行 |
工具让AI具备智能体能力。给AI一把锤子,它就能建造。把它关在聊天窗口里,它只能描述建造过程。
从建议到执行
这种转变在实践中是什么样的。
建议模式(传统聊天):
你:“我需要为SaaS产品构建一个带有英雄区域、功能网格、定价表和页脚的落地页。”
AI:“这是一个你可以使用的HTML结构示例… [提供代码片段]。对于样式,你需要使用Tailwind类,比如… [更多代码]。对于定价组件,考虑这种方式… [另一个片段]。”
你:[复制代码,创建文件,粘贴片段,调试问题,回到聊天寻求澄清,重复]
执行模式(智能体对话):
你:“我需要为SaaS产品构建一个带有英雄区域、功能网格、定价表和页脚的落地页。”
AI:“我来为你创建落地页。先设置结构……”
[创建index.html]
[创建styles.css]
[编写英雄区域HTML]
[实现功能网格]
[构建定价组件]
[添加页脚]
[运行本地开发服务器测试]
[检查输出,发现间距问题]
[修复英雄区域的内边距]
[提交更改到git]
AI:“完成了。落地页可在localhost:3000查看。我调整了英雄区域的间距,使其更符合现代SaaS的美学风格。需要我再添加什么吗?”
输入相同。输出本质上不同。一个产出的是说明,另一个产出的是产品。
真正的力量:反馈循环
但这里有个没人告诉你的事,直到你亲身体验。
你真的不知道自己想要什么,直到你看见它。
这不是思维缺陷,而是人类的学习方式。我们不擅长写规格说明,但非常擅长评估。我们无法完美描述想要的东西,但看到时能立刻认出来。
在建议模式下,这会产生摩擦。你描述需求,AI给你代码,你实现它,你看看效果,发现不太对,回到聊天,尝试描述哪里不对,得到更多代码,继续迭代。循环很慢,因为实现步骤是手动的。
在智能体模式下,循环很紧密。AI构建,你审查,你说”就这个,但这里多点空间,标题更粗一些”。AI立即更新。你看到变化。“好多了,但现在定价区域感觉不平衡。“AI调整。三分钟后,你得到了一个一开始无法规格化的东西。
对话不只是在生成产品,它在揭示产品应该是什么样子。
这是关键所在。你不是在构建前试图完善规格说明,而是通过构建来发现规格说明。
让我用一个真实例子来展示这看起来是什么样的。
通过发现来构建
上周,我请Claude Code构建一个简单的内容性能追踪仪表板。以下是对话实际的进展:
我:“我需要一个显示流量最高的10篇博客文章的仪表板。”
[Claude构建了一个带有文章标题和页面浏览量的基本表格]
我:“好的开始。能添加趋势指标吗?比如流量是否比上周增减?”
[Claude添加了箭头和百分比变化]
我:“不错。实际上,能给这些百分比加颜色编码吗?增长绿色,下降红色。”
[Claude添加了条件着色]
我:“嗯,表格感觉很拥挤。能把间距调大,并让标题变成指向实际文章的可点击链接吗?”
[Claude调整了间距并添加了链接]
我:“你知道什么会有用吗?看到流量来源分布。有多少来自Google、社交媒体、直接访问。”
[Claude添加了显示来源分布的迷你条形图列]
我:“太棒了。另外,能添加一个日期范围选择器让我比较不同时间段吗?”
[Claude实现了日期选择器并更新了数据获取逻辑]
**结果:**一个我一开始无法规格化的仪表板。我通过迭代发现了自己需要什么。
**经过时间:**从第一条消息到最终产品12分钟。
如果我试图预先写出完整的规格说明,我现在还在写。或者更糟,我会规格化错误的东西然后完美地构建出来。
这就是智能体对话的超能力。不仅AI可以执行,而且执行速度足够快以支持发现。
无尽的过程
这听起来像个问题,但实际上是个特性:你永远不会完成。
每次审查AI构建的东西,你都会想到改进。把标题做得更大。添加动画。更换配色方案。添加搜索功能。重新组织布局。集成API。添加身份验证。
在传统开发中,这感觉很累人。每个新想法都意味着更多实现工作、更多时间、更多精力。待办事项增长得比你能处理的还快。
在智能体对话中,这感觉很自然。因为实现不再是瓶颈。想法直接流向执行。
你想:“如果添加一个暗色模式切换会怎样?”
你说:“添加暗色模式切换。”
三十秒后,它存在了。
你想:“移动端布局可以更好。”
你说:“改善移动端响应性。”
完成了。
过程变得无尽,因为迭代成本趋近于零。
这不是缺陷,这是创意工作真正发生的方式。构建、评估、改进。区别是速度。在传统开发中,循环需要几小时或几天。在智能体对话中,只需几秒或几分钟。
产品永远感觉不到”完成了”,因为你不断发现它能成为什么。但这不是混乱——这是速度赋能的工匠精神。
真实体验是什么样的
让我诚实地说说这种工作方式实际上是什么感觉,因为营销材料让它听起来很完美。
它并不完美。
AI有时会误解你。它会做出你不想要的更改。它会破坏原本好用的东西。它会编造不存在的文件路径或函数名称。你需要纠正它。
但这是让我惊讶的:纠正比创建更快。
当Claude Code写出有bug的函数时,我可以说”修复第47行的错误”,它立即被修复。当它误解我的意图时,我可以说”实际上把按钮放在左边”,它就调整了。反馈循环如此紧密,以至于错误成本很低。
与传统开发相比,我写代码、运行它、看到错误、找到bug、修复它、再次测试。或者更糟,实现了错误的东西不得不重写。
在智能体对话中,调整方向只需秒。在手动编码中,需要分钟或小时。
这改变了构建的心理。不再试图一开始就完美(这会拖慢你),你可以快速迭代。构建、审查、改进。构建、审查、改进。
迭代速度比第一次尝试的准确性更重要。
何时使用智能体对话
智能体对话并非适合所有事情。以下是它的亮点场景:
使用智能体对话的场景:
- 从零开始构建新事物(网站、工具、文档、演示文稿)
- 对多个文件进行更改
- 通过迭代探索你想要什么
- 学习新技术或框架
- 快速原型化想法
- 需要文件操作的重复性任务
不使用智能体对话的场景:
- 在复杂系统中需要深度精确的手术式操作
- 风险高且错误代价昂贵的场景(金融系统、医疗设备)
- 在严格监管环境中无审批流程的工作
- 任务主要是战略思考而非执行
- 比执行速度更需要人类判断的场景
模式:智能体对话在创造和迭代方面出色。在高风险精确度和战略判断方面有困难。
对于大多数知识工作——构建原型、创建内容、整理报告、探索想法——它是颠覆性的。
通往自主智能体的桥梁
智能体对话处于两个世界之间。
在第1篇,我们将聊天视为基础——对话如何让你用自然语言与AI协作。智能体对话赋予这种对话执行力。你还在对话中,但现在对话产生真实的工作。
在第3篇,我们将探索自主智能体——AI在没有持续人工监督的情况下运作。你定义目标,AI在数小时、数天或数周内找到实现它们的方法。
**智能体对话是桥梁。**它教会你如何与采取行动的AI合作。它向你展示当对话变成创造时会发生什么。它为最终转变做好准备:从对话到委托。
对话仍然重要。你还在那里,引导、评估、调整方向。但工作以AI的速度发生。
这是关键。不只是建议,而是执行。不只是规划,而是构建。
当你给AI工具时,对话就变成了创造。
自己尝试智能体对话
准备好体验从建议到执行的转变了吗?
从这些平台开始:
- Claude Code — 终端智能体编程(有免费版)
- Cursor — 内置智能体能力的IDE
- TeamDay — 面向企业用户的智能体AI(多智能体编排)