AI在线 AI在线

理论

OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复

AI Coding火了大半年,AI Debugging也来了! 刚刚,OpenAI发布由GPT-5驱动的“白帽”Agent——Aardvark(土豚)。 这只“AI安全研究员”能帮助开发者和安全团队,在大规模代码库中自动发现并修复安全漏洞。
10/31/2025 9:02:07 AM

AI是「天才」还是「话术大师」?Anthropic颠覆性实验,终揭答案!

颠覆传统AI认知! Anthropic首席执行官Dario Amodei雄心勃勃,早已立下flag:在2027年前,大多数AI模型问题将被靠谱地检测。 但LLM的幻觉与生俱来,根深蒂固。
10/31/2025 9:00:00 AM

字节发布通用游戏智能体!5000亿token训练,用鼠标键盘吊打GPT-5!

用鼠标和键盘打游戏的智能体,这就来了! 它不仅能在《我的世界》中和普通玩家一较高下。 还能玩《神庙逃亡》、《星露谷》,甚至可以在未见过的3D网页游戏中实现零样本迁移。
10/31/2025 8:51:00 AM

世界模型有了开源基座Emu3.5!拿下多模态SOTA,性能超越Nano Banana

最新最强的开源原生多模态世界模型——北京智源人工智能研究院(BAAI)的悟界·Emu3.5来炸场了。 图、文、视频任务一网打尽,不仅能画图改图,还能生成图文教程,视频任务更是增加了物理真实性。 先感受一下它的高精度操作:一句话消除手写痕迹。
10/31/2025 8:50:00 AM

字节跳动放大招!SAIL-VL2横空出世,多模态视觉语言模型的巅峰之作

随着人工智能技术的不断发展,多模态模型在图像理解、自然语言处理等领域的应用越来越广泛。 SAIL-VL2 是由字节跳动抖音 SAIL 团队和新加坡国立大学 LV-NUS 实验室联合推出的一款开源多模态视觉语言模型,旨在实现全面的多模态理解和推理。 一、项目概述SAIL-VL2 是由字节跳动抖音 SAIL 团队和新加坡国立大学 LV-NUS 实验室联合开发的开源视觉语言基础模型。
10/31/2025 2:25:00 AM
AGI小兵

智能体可能通过普通网络搜索泄露企业数据

该研究由Smart Labs . AI和奥格斯堡大学共同开展。 作者希望了解间接提示注入在实际应用中(而非仅在孤立案例中)是如何运作的。
10/31/2025 2:00:00 AM
Mirko

n8n + AI Agent 提示工程:2025 年最有效的实操技巧

为什么大多数 Prompting 方法会失效根据 Anthropic 的 Context Engineering 研究,在 2025 年,真正重要的不是“prompt engineering”,而是“context engineering”。 问题不再是“如何打造完美的 prompt”,而是“哪种 context 组合能引发期望的行为”。 我会带你走一遍当前研究(Anthropic、OpenAI、Google、Wharton)对 AI agent prompting 的结论——以及如何在 n8n 工作流中具体落地。
10/31/2025 1:45:00 AM
AI研究生

MCP与API网关:不可互换的各自定位

传统API网关难以处理有状态的MCP协议,其会话、流式和多路复用等特性需要Agentgateway等专用网关来解决。 译自:MCP vs. API Gateways: They’re Not Interchangeable[1]作者:Christian Posta我合作的组织正在迅速采用模型上下文协议 (MCP)[2],通过AI 代理[3]将其服务和数据连接到 AI 模型,但它们遇到了熟悉的挑战:如何在提供路由、速率限制、可观测性和开发者门户的同时,保障对 MCP 服务器和工具的访问安全。
10/31/2025 1:33:00 AM
岱军

AI Agent的觉醒时刻:FlowithOS,一场数字革命的序幕

朋友们,当我们在谈论AI的时候,脑海中浮现的往往是那些能够“回答问题”、“生成内容”的强大模型。 但如果我告诉你,一场更深层次的变革正在悄然发生,AI不再满足于“动脑”,而是要“动手”了呢? 最近,AI圈子里炸开了一个重磅消息:一家名为Flowith的初创公司,在2025年10月28日,正式向世界推出了他们的全新产品——FlowithOS。
10/31/2025 1:25:00 AM
墨风如雪

AGI前途暗淡,超本地化智能才是未来?

通用人工智能(AGI)的智力可以与人类媲美,甚至超越人类。 过去十年,AGI一直是科技巨头追求的目标,Meta、OpenAI等为此投入巨资研发。 就在AGI已成为美国人工智能企业的“战斗口号”时,不少人提出质疑,担心AGI缺乏可行性,转而开始重视超本地化智能(Hyperlocal-intelligence)。
10/31/2025 1:00:00 AM
小刀

Cursor 2.0来了!可视化的Claude Code?

如果把IDE的主角从“文件”挪到“代理”,会发生什么? Cursor 2.0 给出了一个很大胆的答案:界面不再围绕文件树展开,而是以“多个智能体”的协作来组织你的工作。 这次更新不只是加了一个侧栏或几个按钮,而是把多智能体并行、结果择优、改动可视化这些能力,变成了默认的交互基础。
10/30/2025 4:23:47 PM

烧钱速度吓坏投资者:Meta、微软、谷歌 AI 支出暴增引“泡沫”质疑

10 月 30 日消息,科技巨头正押注未来人工智能的发展,其核心是依靠由成千上万台嗡嗡作响的服务器组成的庞大数据中心集群。 如今,这一雄心勃勃计划背后的惊人成本正逐渐清晰浮现,并开始考验华尔街的耐心与信心。 来自科技领域不同分支的三家领军企业 ——Alphabet 公司、Meta Platforms 公司和微软公司(Microsoft Corp.),在上个季度的资本支出总额高达约 780 亿美元(IT之家注:现汇率约合 5540.4 亿元人民币),较去年同期激增 89%。
10/30/2025 4:21:13 PM
远洋

OpenAI 再出开源力作 Safeguard 模型:可完整展示 AI“思维链”,强化内容分类能力

10 月 30 日消息,科技媒体 NeoWin 昨日(10 月 29 日)发布博文,报道称 OpenAI 公司推出 gpt-oss-safeguard-120b 和 gpt-oss-safeguard-20b 两款开源权重模型,专门用于根据用户提供的策略对内容进行推理、分类和标记。 这是继今年早些时候发布 gpt-oss 系列推理模型后,OpenAI 在开源领域的又一重要举措。 新模型是此前 gpt-oss 模型的微调版本,同样遵循宽松的 Apache 2.0 许可证,允许任何开发者免费使用、修改和商业部署。
10/30/2025 4:21:13 PM
故渊

老黄亲自站台,英伟达编程神器!Cursor 2.0自研模型狂飙4倍

Cursor迎来重大升级,2.0版本来了! 一直「套壳」的Cursor这次终于发布了首款自研编码模型Composer。 Composer的速度是同等模型的4倍。
10/30/2025 4:11:29 PM

别再迷信大模型!吴恩达亲授AI秘籍:小模型+边缘计算=财富密码

AI创业的真机遇不在「更大」,而在「更聪明」! 当巨头们在百亿美金的赛道上比拼模型参数时,真正的创业机会正在另一端悄然爆发——智能体的时代,正在打开。 这是AI世界的「中小企业革命」:它不追求通用智能的神话,而是用成千上万个专注、可靠、懂业务的智能体,去啃下那些不起眼却极其值钱的现实问题。
10/30/2025 4:10:20 PM

陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

今天,谷歌DeepMind重磅发起「AI赋能数学计划」,集结了全球五大顶尖机构。 他们将用上谷歌最强数学AI,去探索发现新的疆域。 这其中,有夺下IMO金牌的Gemini Deep Think,有算法发现AI智能体AlphaEvolve,还有形式化证明自动补全AlphaProof。
10/30/2025 4:08:28 PM

Meta AI部门大地震!小扎急派心腹干将「救火」

Meta AI部门再现人事大地震! 刚刚,Meta传出重大人事调整:前元宇宙负责人Vishal Shah将转岗至Meta超级智能实验室,担任人工智能产品副总裁,并向Nat Friedman汇报。 这是Meta AI部门最新一次高管调整。
10/30/2025 4:05:42 PM

中科院联合清华等发布视觉语言行动推理模型VLA-R1,让机器人先思考再行动

还记得 DeepSeek R1吗? 它实现了大语言模型先思考再回答。 刚刚,中科院自动化所、清华和GigaAI联合发布视觉-语言-行动(Vision-Language-Action, VLA)模型的R1推理版本。
10/30/2025 4:04:35 PM