AI在线 AI在线

DeepSeek新大招曝光:下一步智能体

DeepSeek下一步,被曝剑指智能体。 知情人士透露,DeepSeek正在开发具有更强大AI Agent能力的新模型,预计在今年年底就会推出。 官方尚无回应,但这一爆料并非无迹可寻。

DeepSeek下一步,被曝剑指智能体。

知情人士透露,DeepSeek正在开发具有更强大AI Agent能力的新模型,预计在今年年底就会推出。

官方尚无回应,但这一爆料并非无迹可寻。

在DeepSeek 8月的最近一次更新中,DeepSeek-V3.1上线。官方发布的升级公告中就提到:

DeepSeek-V3.1具备更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

迈向Agent时代的第一步

图片图片

“R2”将造更强智能体?

彭博社援引知情人士消息,爆料DeepSeek的下一个模型,仅需少量提示,就能帮用户执行复杂操作,并且还能根据历史操作自我进化和学习。

这一模型将在今年最后一个季度面世。

此前,业内普遍推测,按照DeepSeek V3和DeepSeek R1的发布节奏,在被期待已久的“R2”之前,DeepSeek应该会先一步推出新一代V系列的基础模型。

而从去年12月到今年8月的近9个月时间里,DeepSeek V系列的版本号只从V3来到了V3.1。

看上去仅仅是小版本的改进,但从DeepSeek官方后来公布的测试结果来看,似乎又暗藏玄机。

DeepSeek-V3.1的主要升级包括3点:

  • 混合推理架构,就是把思考模式和非思考模式都集成到了一个模型里。
  • 更高的思考效率,比DeepSeek-R1想得更快。
  • 更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

具体来看提升效果。

编程智能体方面,在代码修复测评SWE和命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相较V3和R1有明显提高。

图片图片

而在搜索智能体测评中,相较于DeepSeek-R1-0528,DeepSeek-V3.1也展现出了全面的性能提升。

图片图片

下一个DeepSeek时刻

DeepSeek R1将推理模型推向发展新高潮,成了搅动全球大模型行业格局的一尾鲶鱼。

Manus让智能体的概念火爆出圈,被称为“第二个DeepSeek时刻”——

来到2025年的下半年,几乎没有大模型产品不谈智能体。吴恩达也在最新Andrew’s Letters中提到:并行智能体正在成为提升AI能力的新方向。

图片图片

早早预定2025年年度热词的DeepSeek和智能体一叠加,立刻又触动了人们兴奋的神经。

已经有人开始期待:如果是DeepSeek来做这件事,那智能体的价格门槛,真的要被打下来了。

图片图片

但也有人保持怀疑:这个时候入局智能体,还算好时机吗?

图片图片

不管怎么说,可以确定的是,在2025年余下的最后1/3时间里,大模型领域的热闹依然将每天持续。

最后的最后,小小One More Thing一下,信源来自官方,妥妥靠谱:

图片图片

Qwen 3 max也要来了吗?

欢迎一起,见证下一个历史时刻。

相关资讯

“不是新模型赢了,是新数据赢了”:另一种角度解读 AI 进步的真相

最近,小编读了一篇康奈尔大学 (科技校区) 博士生 JACK MORRIS写的博文,发现其对人工智能(AI)的进展解读挺有趣。 想分享给读者。 这篇博文的核心意思是:人工智能领域的飞速发展,其核心驱动力并非源于理论的革新,而是对全新数据来源的成功利用。
7/4/2025 12:00:00 AM

Qwen深夜升级235B模型,重夺王座、全面超越Kimi K2!还预告了一个重磅更新

Qwen 深夜上新!  Qwen3-235B-A22B-2507 系列正式启动,今天率先登场的是非思考模型 —— Qwen3-235B-A22B-Instruct-2507。 在最新基准测试中,新模型全面超越 Kimi K2,开源王冠再度回到 Qwen 头上!
7/22/2025 11:03:07 AM

这篇 AI Agent 漫游指南,带你建立全面的科技史观

作者 | kong以OpenAI o1与DeepSeek R1为代表的"类Agent"模型、OpenAI DeepResearch为代表的“真Agent”模型,正在重构AI Agent的技术范式。 Agentic Workflow的王座还没坐热,强化学习驱动的端到端Agent模型训练已呼啸而来。 未来趋势已指明:模型即产品,工程化Agent的命运将如何?
5/27/2025 10:05:00 AM
腾讯技术工程
  • 1