AI在线 AI在线

要有野心!创始人揭秘Claude4诞生:有点玄学,很快接入测谎仪!26年出现单人独角兽!做AI像登上太空飞船,MCP快行业标准了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周五 Claude 4 的发布会上,Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。 两个人都是创业公司的创始人,又都参与了同一款 AI 产品的打磨与迭代。 对于AI 编程,Anthropic 的产品路线图将是什么样子?

编辑 | 云昭

出品 | 51CTO技术栈(微信号:blog51cto)

上周五 Claude 4 的发布会上,Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。

两个人都是创业公司的创始人,又都参与了同一款 AI 产品的打磨与迭代。对于AI 编程,Anthropic 的产品路线图将是什么样子?未来 Claude 的技术走向如何?未来12个月? 两人都在这次二十多分钟的谈话中,频频语出惊人。

有意思的是,作为很早就投身大模型的研发之中,Dario 坦承自己其实没搞懂所有细节,并强调:模型开发过程中常常有种几乎是“迷信”的过程,总是在关键时刻才能“齐活儿”。

Dario做了一个形象的比喻:做AI就像登上了一艘以相对论速度飞行的太空船。船上一天,地球三天。

同时,Dario 认为,很快就可以通过连接测谎仪来测试 Claude 是否说谎了。Mike 顺势调侃道:现在谁还需要“可解释性”?用测谎仪就够了。

再比如,提到多久才会出现单人公司而且估值超过 10 亿美元?Dario 不假思索地回答:2026 年。

此外,Dario 还对于 Claude 4 的开发过程、大模型的后训练扩展定律、MCP 的出圈、大模型和小模型的未来、五年后自己向往回归生命医学领域等等,都给出了自己的判断和期许。

整体上看,猛料可圈可点,建议大家自行收藏细读。以下是谈话全文整理。

1.Claude 4 的诞生有点“玄学”前期都不太行,但某个时刻突然就好了

Mike Krieger :

在节目的尾声,我想深入探讨一下Claude在我们研究方向上的角色,以及开发者接下来可以从Anthropic期待什么。让我们欢迎Dario回来,进行一对一的对谈。欢迎回来,Dario。

Dario Amodei :

大家好,又见面了。

Mike Krieger :

这太棒了,就像是面对整个观众席的一对一对话。那么Claude Sonnet 4 和 Claude Opus 4 现在都已经发布了。你对Claude 4模型最兴奋的地方是什么?它如何改变了你对未来12个月可能实现目标的看法?

Dario Amodei :

抽象地说,我最兴奋的一点是:每当我们有一代新的模型,就意味着可以实现更多新任务。所以,我们还会继续推出后续的 Claude 模型,可能会有 Claude 4.1,就像我们当初发布 Sonnet 3.5 一样。我认为我们才刚刚开始挖掘新一代模型的潜力。尤其是在自主性方面,它将比以往走得更远。你可以“放飞”模型,让它长时间完成某项任务,这种能力才刚起步。

Dario Amodei : 

我对模型在网络安全任务中的应用越来越感兴趣。你可以把网络安全看作编码任务的一个子集,但它往往是更高端的那类任务。我觉得我们可能终于达到了应对这类任务的门槛。  另外,作为前生物学家,我也很兴奋看到模型在生物医学和科学研究领域的应用。我认为 Opus 在这些方面会特别强大。

Mike Krieger :

这让我想起那篇《Machines of Loving Grace》(充满爱与优雅的机器)。Claude 4如何契合这个技术发展路径?我常开玩笑说,有人把那篇文章当作随笔看,我却把它当成未来几年的产品路线图。那么你觉得Claude在这个旅程中扮演什么角色?

Dario Amodei :  

其实那像是一份我自己也不知道怎么实现的产品路线图,我写完后就说:“好了伙计们,这是你们的任务了。”我们越来越多地在生物领域思考,而软件正是这个领域的一部分,因为生物研究越来越依赖数据。  

十年前我还是生物学家时,数据已经很重要了。现在,我们拥有这些懂得生物学的模型,它们可以帮助写代码。如果你是一名计算生物学家,这些模型能大幅加速你的研究。我们也已经有不少客户在尝试将这些模型用于这类任务。

Mike Krieger : 

我记得我们发布 MCP 后参与的第一个黑客马拉松,有人把 MCP 接到了一个绘图仪上。Claude 居然能自己画图,看到 Claude “为自己画画”真的很好玩。这也说明了 MCP 不只是能连接数字系统,也能连接现实世界。所以我觉得用 Claude 驱动实验室设备会很有趣。

Dario Amodei : 

很快我们就可以通过连接测谎仪来测试 Claude了:“你在说谎吗?”

Mike Krieger :  

谁还需要可解释性?我们有测谎仪就够了!你之前提到有个瞬间你觉得Claude写的内容就像人类写的一样。还有其他那种让你意识到“这模型不一样了”的突破性瞬间吗?

Dario Amodei :  

我其实没搞懂所有细节,但在模型发布前几周,有个同事说:“天啊,这模型居然一击完成了一个极其复杂的性能优化任务。”以前从来没有哪个模型做到过。我想说的是,模型开发过程中常常有种几乎是“迷信”的过程:就算训练流程早已规划好,但某些能力总是在最后关头才“齐活儿”。也许是人们与模型的互动,也许只是最后的微调特别关键。每次模型刚上线时,人们都会摸索该怎么用,但某个时刻过后,他们就会说:“哇,这太好用了。”这种魔法,总是在最后一刻发生。

Mike Krieger : 

《Creativity Inc》这本书里Ed Catmull也说过,动画电影也是这样:上线前两天还很糟糕,然后突然“开窍”了。我感觉我们做模型也是这样:前期都不太行,但某个时刻突然就好了,让人迫不及待地想发布。

Dario Amodei : 

这真的没法用理性解释。你以为训练过程是线性的、可预测的,但现实不是这样。

Mike Krieger :

是啊,完全不是。RL的曲线也没有告诉你最后一刻会有这种“临门一脚”。

Dario Amodei :

所有东西都在最后一刻拼到一起了,我也不知道为什么。那才是真正的时刻。

2.朝着更高模型自主性前进

Mike Krieger : 

在座的许多观众是开发者,我们内部也常有人在讨论一个问题:AI越来越强,软件工程中哪些部分会被它接管?在自主智能体可以执行大量编程任务的世界中,什么会变得更重要?

Dario Amodei :

我跟很多人一样,几个月前认真读了Steve Yegge写的那篇《初级程序员的复仇》。他以前也写过类似文章,甚至来拜访过我们。他对未来的描述比我还要准确:我们正逐步朝着更高模型自主性迈进。

Dario Amodei  :

我们经历过“自动补全”的阶段,现在有了所谓的“vibe coding”,而接下来就是“派遣代理人去完成任务”。Claude Code 就是往这个方向发展的,我们也会有其他产品支持这种方式。我们正进入一个开发者可以像“管理车队”一样指挥AI代理人工作的世界。但人类仍需参与质量控制,确保AI做的正确、细节到位。

Dario Amodei  : 

所以,无论是模型本身还是产品界面,开发人机协同的细节会变得极其重要。

Mike Krieger  : 

这也让我意识到,工作中那些低效的部分变得更痛苦了,因为它们让人脱离了“创造的流动”。比如我们花太多时间在跨部门协调和排期上,其实本该投入到“造东西”上。  

3.未来1~2年,大模型会成为人类的同行

Mike Krieger  : 

行业里有无休止的争论:大模型架构和小模型架构,到底谁才是未来?你因提出“扩展规律”而出名,现在的看法如何?预训练是否仍然是一切的关键?后训练的作用又如何?

Dario Amodei :

我不谈太多细节,但Claude 4系列模型在预训练和后训练两方面都有明显进展。预训练的扩展规律依然成立,后训练也在持续进步,这两者是互补的。未来我们也会继续扩大模型规模。这些趋势彼此叠加,会造成指数级增长,这也是为什么我认为整个进程会非常快。我喜欢Yegge的那篇文章,是因为他帮我说出了我常说的一句话:再过一两年,这些模型就会成为我们的“同行”。

Mike Krieger : 

太疯狂了,Claude 3.7才是在二月发布的,但感觉像过了一年。

Dario Amodei  :

对啊,其实只过了三个月,甚至不到2.5个月。时间在加速。我常打比方说:做AI就像登上了一艘以相对论速度飞行的太空船。你在船上过一天,地球就过两天,再过一阵,船上一天,地球三天。你要迅速消化更多信息。这就是我们在这趟旅程中的感觉。

4.后训练:大模型可以管理记忆

Mike Krieger : 

这个比喻太贴切了。说到后训练,我特别兴奋的一点是Claude 4加入了“记忆”能力。模型可以管理自己的记忆。这为什么重要?又能实现什么呢?

Mike Krieger  : 

我再重复一下问题:让模型管理自己的记忆,并处理长期任务,这为什么很重要?

Dario Amodei  10:35  是的,我们发现这非常有用。比如有一个场景是玩《宝可梦》,模型能记住状态。但这种能力远不止用于游戏。对人类来说,我们会写笔记,会在之后查阅,模型也应该能这样。有时候我会写中间文档、写演示文稿——这些不可能全靠“记忆缓冲区”完成。  所以模型也一样:它们需要创建文件、处理文件、加载数据,在内部“无缝处理”这些中间工作。

Dario Amodei :  我们新增的功能之一,是模型能在推理与行动之间交替进行。这些行动有时包括存储数据、调用数据等。这其实意味着,模型逐渐具备了类似人类的“行为能力”,我认为这是应有的发展方向。

5.安全性和能力可以并行发展MCP就是一个例子

Mike Krieger :

我在使用 Claude 4 时印象最深的一刻,是我们用 Claude Code 创建了一个待办事项的草稿板,然后看着它一点点处理这些事项。当它想到新的任务时,就添加进去,同时勾掉已完成的、划掉不再相关的,整个过程特别像人类自己管理工作的方式。它在推理与工具使用上也表现出很强的交织能力。比如今天早上我看到一篇 Max Stories 的文章,说 Claude 在使用一个叫 MCP 的工具时遇到了服务端的速率限制,然后它自己判断:“哦,我可能触发了速率限制,我换个方法试试看。”这种边推理边补救的能力非常强大。

Mike Krieger :  

我想回到“竞赛的顶端”这个话题。通常人们会认为安全性和能力是对立的,而你们的观点恰恰相反,认为这两者可以并行发展。我觉得这个想法非常鼓舞人心,也是我加入这里的原因之一。能不能谈谈你们如何理解“顶级竞赛”的?

Dario Amodei : 

我认为这个观点既适用于简单的商业场景,也适用于 AI 的宏大未来方向。我们有不少客户非常在意他们的模型行为是否可预测、是否可信。这其实和我们长期目标是一致的——确保模型从更宏观的层面上也能对齐人类意图。这之间其实存在一种很好的协同效应。每当我们认为合理且负责任的时候,我们都希望把工具分享给社区,比如 MCP 就是个例子。

Dario Amodei :

我自己也惊讶于 MCP 被采纳的速度。我们去年 11 月发布它时,反响其实没那么大。但三四个月之后,它几乎就成了行业标准。这种感觉就像坐在飞船上离开地球,时间膨胀越来越大。你想想以前像 USB 那样的标准,90 年代一个标准可能要花几年时间才能统一,而现在几个月就可以。

6.AI与神经科学是两码事

Mike Krieger :  

是的,我跟业内的其他人谈 MCP 时,他们都说“别拖慢 MCP 的发展节奏”,虽然也希望有点指导方向,但都觉得 MCP 抓住了关键,要确保它成为互操作代理的标准协议。也和“竞赛顶端”这个话题有关。我很喜欢你那篇关于可解释性紧迫性的文章。你有神经科学背景,能谈谈你怎么看可解释性与机器智能的共同演进吗?

Dario Amodei :  

十年前,很多人认为神经科学会告诉我们该怎么做 AI。的确,有不少前神经科学家加入了这个领域,不止我一个,一些实验室负责人也有类似背景。我发现,神经科学确实提供了一些启发,但并不能直接迁移。你不能说“下丘脑的这个机制可以用来造模型”,我们几乎是一切从零开始。

Dario Amodei : 

有趣的是,反而是我们通过可解释性技术看进了模型内部,尽管它们和人脑的结构完全不同,但却在概念层面上有些相似之处。比如,有团队通过可解释性研究发现视觉模型中有高频和低频信号检测机制,而几年后神经科学家在动物大脑中也发现了类似的东西。

Dario Amodei :  

比如说,视觉模型会把颜色处理和亮度、边界处理分开成两个路径,这种划分在现实世界中就很自然,不论是生物学习系统还是人工系统,都会收敛到这些基本概念上。这真的很有趣。

7.一人独角兽公司会出现在2026年要有野心!

Mike Krieger : 

我也很好奇,Circuits 项目未来是否也会对神经科学研究产生影响。那我们来聊聊五到十年的时间跨度——虽然在 AI 领域这几乎不可能预测。我们现在像是在光速前进,也许五到十年其实就是现实世界中的一年时间。你觉得什么时候会出现第一个只有一个人类员工,但估值达十亿美元的公司?

Dario Amodei :

2026 年。

Mike Krieger :  

完全认同。那么你有没有建议给未来一年准备基于 Claude 构建产品的人?该怎么思考前沿构建?

Dario Amodei :

当然有很多具体的建议,但因为我们正经历“相对论时间膨胀”,一切发展太快,所有细节都可以用一句话总结:要有野心。去构建那些你本来以为做不到的东西。即使现在做不出来,下一个版本的模型可能就能实现了。目前模型发布的节奏是三个月一次,也许很快会变成两个月、一个月,甚至未来你早上刚构建的东西,晚上发布的新模型就已经把它淘汰了。

Mike Krieger :

我认识一位创业者,两年前开始做 AI 编程代理,他试了所有模型都没成功。直到 Claude 3.7,他说“我创业的点现在终于能实现了。”就像他之前一直很难,但现在突然就变成可能了。

Dario Amodei :  

有时候“撞墙”反而有帮助,你把其他所有部分都准备好了,就等模型到位。一旦模型成熟,你的产品就会非常扎实,可能比实际需要的还强。这种超额设计反而变成了优点。所以虽然我开玩笑说“等等下一代模型”,但如果你做的事情已经“差不多快能实现了”,那继续坚持是值得的。

Mike Krieger :

我们在内部做前沿研究时也有类似经历,我们的研究团队做出一个原型,但模型当时不擅长用工具。直到 Claude 3.7 出来,特别是在研究场景中它的表现非常出色。而正是我们之前那些“失败的尝试”铺垫了这次成功。

Dario Amodei :

确实,有点像你应该把自己的创业项目当成是对“下一个模型”的投机性执行(speculative execution)。像是……

8.接下来的一到五年:软件开发成本降到几毛钱

Mike Krieger : 

我太喜欢这个说法了,完全正确。那么最后一个问题,对于我们大多数人来说,现在 AI 的发展远超预期。你对未来一年,乃至五年最感兴趣的是什么?

Dario Amodei :  

未来一年,我觉得我们会在代码领域看到非常惊人的进展。从 Claude Code 到基于代理的系统,软件的生产成本会急剧下降。过去,只有你预期有几万人、几十万人用,才会去开发一款软件。但未来,当软件开发成本降到几毛钱,你可能就会临时做一个小工具,用在某个会议或某个活动上。软件可以按需生成,几秒钟、一美元以内搞定,整个世界会变得很不一样。

Dario Amodei :  

那时候开发者的角色是什么?企业和创业公司的角色又是什么?最终用户的体验又该如何?这些我们还都不知道。

Dario Amodei :  

至于五年后,我又回到生物医学领域。虽然这一年不会有太多革命性变化,但我希望五年后我们能攻克一些今天仍然存在的重大疾病。

Mike Krieger :

太棒了,我们就以这个美好的愿景收尾吧。时间关系我们得结束了,其实我感觉还能聊上 40 分钟。非常感谢 Dario 今天和我们分享!

Mike Krieger :

也感谢现场和线上观众的参与。差点忘了一个好消息——作为对大家参加 Code with Claude 线下活动的特别感谢,我们将为每位到场观众提供 Claude Max 20x(最高等级套餐)三个月免费使用资格,请留意后续通知。

Mike Krieger :  

我个人也很喜欢在 Claude Code 上使用 Max 套餐,期待看到你们构建出的精彩作品。祝你们今天在各个分会场玩得开心,再次欢迎大家来到 Code with Claude!

Dario Amodei :  

谢谢大家的到来!

ok,文章到这里就结束了,各位看完有何感想呢?欢迎评论区交流。

参考链接:https://www.youtube.com/watch?v=EvtPBaaykdo

相关资讯

全靠Claude4!30年FAANG老工程师:AI帮我解决了四年老bug

AI 就像一头野驴,跑起来就不停。 人类花了几百万年才走上食物链顶端,而大模型只用了不到十年时间,已经能把你和刘亦菲 P 进一张自拍了。 奥!
5/28/2025 11:49:52 AM

Claude 4 Sonnet与Opus即将发布!Anthropic“Keynote”流揭秘,AI编码革命还是另有玄机?

Anthropic的下一代AI模型Claude4Sonnet和Claude4Opus即将发布的消息在社交媒体引发广泛讨论。 据悉,这两款模型将在未来几周内亮相,具备在“思考模式”与“工具使用模式”间灵活切换的能力,旨在以更少的用户干预处理复杂任务。 与此同时,Anthropic定于本周四(5月22日)举办的“Keynote”流和Claude Code功能备受关注,引发业界猜测其是否与Claude4的发布直接相关。
5/20/2025 11:00:55 AM
AI在线

Anthropic震撼发布Claude4 :全球最强编码AI,自动写代码 7 小时刷新纪录

作为人工智能领域的先锋,Anthropic于2025年5月22日正式发布了Claude4系列模型,包括Claude Opus4和Claude Sonnet4,开启了编码、复杂推理和 AI 代理的新篇章。 Claude Opus4被誉为全球最佳编码模型,能够持续高效地处理复杂的长时间任务和代理工作流。 而 Claude Sonnet4则是对 Sonnet3.7的重大升级,能够更精准地响应用户指令,展现出卓越的编码和推理能力。
5/23/2025 9:00:55 AM
AI在线
  • 1