Hi,大家好,我叫秋水,专注商用 AI Agent(智能体),帮企业用AI自动化业务,提升效率。
在刚刚结束的一场AI技术峰会上,深度学习领域的传奇人物吴恩达与LangChain创始人Harrison进行了一场精彩的谈话。
这场对话不仅揭示了AI智能体技术的最新趋势,更为普通人和企业指明了在AI时代如何抓住机遇的实用路径。
内容包含:Agentic概念、当前应用现状、三大核心能力(快速评估、语音技术、工具组合)、MCP协议、编程重要性、创业经验、未来机会点及常见误区。
关注我,及时收到后续内容。
给普通人和企业的实用建议
对个人:
- 学习基础编程:不需要成为专家,但要理解计算机思维
- 关注语音技术:这可能是下一个重要机会窗口
- 培养快速迭代能力:完美是优秀的敌人
- 建立工具箱思维:掌握多种AI工具的组合使用
对企业:
- 从简单开始:找到重复性高的线性工作流程
- 允许AI辅助编程:不要因为安全顾虑错失生产力提升
- 建立评估体系:哪怕很粗糙,也比没有强
- 关注MCP等标准:早期参与标准制定能获得先发优势
对创业者:
- 速度第一:快速验证想法,快速迭代产品
- 深耕技术:在某个垂直领域建立技术优势
- 务实选择:不要被概念迷惑,专注解决实际问题
什么是"智能体"?这个概念很重要吗?
传统思维的局限
过去,人们总是纠结于一个问题:这个AI系统到底是不是"智能体"?
就像问一个人是不是"聪明人"——这种非黑即白的判断往往让我们陷入无意义的争论。
有的人问我做过哪些智能体,我都会解释大部分是AI工作流,是的,AI工作流就是AI智能体的一部分,目前阶段来看大部分的可以商用的智能体都是AI工作流。
这跟电影《唐伯虎点秋香》里秋香这个大美女一样,所谓的美女要有比较,现实中,每个人都是帅哥,每个人都是美女。
回到业务上一样,你还在手工记账,那么软件就是智能体,你用软件重复操作同样的动作,那么RPA就是智能体,你在电脑上重复操作的一些懂,AI工作流就是智能体。
不要纠结技术上的智能体,而重点在于利用技术手段,单位时间内让你的生产力提升了多少。
吴恩达提出了一个更有建设性的概念——"Agentic-智能体的自主性程度"。他认为,与其争论某个AI系统是否为"真正的智能体",不如关注它具有多大程度的自主性。
为什么这很重要?
这种思维转变的价值在于:
- 减少无谓争论:不再浪费时间纠结定义,专注于实际应用
- 降低门槛:企业可以从简单的自动化开始,逐步增加智能化程度
- 务实导向:关注解决实际问题,而非追求技术完美
这就像从"这个人是不是专家"转向"这个人在某个领域有多专业"——后者显然更有实用价值。
当前AI智能体在解决什么问题?
许多人以为AI智能体都是科幻电影里的超级AI,他观察到,目前最有商业价值的应用其实相当"简单":
- 表单处理自动化:员工查看网站表单→搜索相关信息→检查数据库→填写另一个表单
- 合规检查流程:核实客户信息→查询黑名单→决定是否提供服务
- 文档处理工作:复制粘贴信息→格式转换→多系统录入
这些看起来平凡的工作流程,实际上蕴含着巨大的自动化潜力。
为什么简单的更有价值?
- 立竿见影:实施周期短,效果明显
- 风险可控:出错成本低,容易修正
- 规模巨大:几乎每个企业都有这类重复性工作
构建AI智能体需要掌握哪些关键技能?
1. 快速评估能力——20分钟法则
现状问题:很多团队谈论评估的重要性,但实际上很少去做,因为他们把评估想象成一个巨大的工程项目。
他建议:
- 花20分钟建立一个"很烂但有用"的评估系统
- 不要追求完美,先解决最痛的那一个问题
- 逐步迭代改进,就像写文章一样先有初稿再修改
2. 语音技术——被低估的金矿
为什么语音比文字更好?
Andrew指出了一个有趣现象:面对空白的文本输入框,很多用户会感到紧张,因为:
- 可以用退格键,所以倾向于追求完美
- 需要组织语言,心理负担重
- 响应速度慢
而语音交互则不同:
- 时间向前流动,不能"撤销",所以更自然
- 可以边说边改,"哦不对,我改主意了..."
- 心理压力小,更容易表达真实想法
技术挑战:延迟是关键
- 理想响应时间:少于1秒
- 解决方案:使用"预回应"("嗯,这很有趣""让我想想")来掩盖处理时间
- 背景音效:在客服场景中播放呼叫中心背景音,用户更能接受等待
3. 工具组合能力——AI时代的"乐高思维"
他用乐高积木做比喻:
- 单一工具:只有紫色积木,能搭建的东西有限
- 多样工具:红色、黑色、黄色、绿色积木,可以快速组装复杂结构
实际应用:
- RAG(检索增强生成)
- 评估系统
- 记忆管理
- 护栏机制
- 各种API集成
随着AI模型上下文长度增加,许多传统方法的重要性在下降。
比如复杂的RAG技术变得不那么必要,因为现在可以直接把更多信息塞进上下文。
MCP协议:连接一切的标准化接口
什么是MCP?
MCP(Model Context Protocol)是一个让AI系统更容易接入各种数据源和工具的标准协议。
形象比喻:就像USB接口统一了电脑外设连接一样,MCP试图统一AI系统与各种工具、数据源的连接方式。
核心价值:
- 之前:n个AI系统×m个数据源 = n×m种集成工作
- 现在:n个AI系统 + m个数据源 = n+m种标准化接口
当前挑战
Andrew坦言MCP仍处于早期阶段:
- 很多MCP服务器不稳定
- 身份验证系统不够成熟
- 缺乏层次化的发现机制
但这正是机遇所在——早期采用者往往能获得先发优势。
关于编程:每个人都应该学会的技能
为什么每个人都应该学编程?
每当编程变得更容易,学编程的人就会增加,而不是减少。
- 从打孔卡到键盘:更多人学会编程
- 从汇编到高级语言:更多人学会编程
- AI辅助编程时代:应该有更多人学编程
他的公司在做的实验:
- 前台接待员会编程
- CFO会编程
- 法务顾问会编程
核心价值:不是让他们成为程序员,而是让他们能更精确地告诉计算机要做什么。
创业成功的两大预测因子
他总结出创业成功的关键要素:
1. 速度是第一生产力
为什么速度这么重要?
- AI技术发展太快,窗口期稍纵即逝
- 快速试错能降低风险
- 市场反馈越早越有价值
实际观察:很多人从未见过真正高效团队的执行速度,一旦见识过就会被震撼。
2. 技术知识是最稀缺资源
为什么技术知识更重要?
- 营销、销售、定价等商业知识相对更容易获得
- 技术发展太快,深度技术理解成为稀缺资源
- 技术直觉能让团队避开无数坑,速度翻倍
语音技术:下一个爆发点
企业已经在行动
他透露,他看到很多大企业对语音应用非常兴奋,已有大量项目在推进中。
但开发者社区的关注度相对不足,这形成了一个明显的供需缺口。
技术路径选择
不推荐:端到端的语音模型(难以控制)
推荐:智能体式语音工作流程(更可控)
端到端模型:就像一个"魔法盒子"
- 你对着盒子说话,它直接用语音回答你
- 但你不知道盒子里发生了什么
- 如果回答错了,你也不知道哪里出了问题
智能体工作流程:就像一个"透明的助手"
- 先把你的话写下来(语音转文字)
- 然后思考你的意思(理解分析)
- 接着查找或生成答案(处理)
- 最后读给你听(文字转语音)
这个建议的背后逻辑是:控制性往往比先进性更重要,特别是在商业应用中。
多智能体系统:还为时过早
Andrew坦诚地表示,虽然多智能体系统听起来很酷,但现实是:
- 单个智能体都很难做好
- 让不同团队的智能体协作需要"两个奇迹"
- 目前成功案例主要来自单一团队内部的多智能体协作
结语:拥抱AI智能体时代
这场对话最大的价值在于,它让我们看到AI智能体技术的真实面貌:不是科幻电影里的超级AI,而是能解决实际问题的实用工具。
当前我们正处在一个关键时刻:
技术足够成熟,可以解决真实问题;
但还不够普及,仍有大量机会等待挖掘。
无论你是技术小白还是企业决策者,现在都是了解和参与AI智能体革命的最佳时机。
记住Andrew的核心观点:
不要纠结于概念的完美,专注于解决实际问题。
在AI智能体的世界里,实用性永远比完美性更重要。