AI在线 AI在线

AI

大模型智能体如何突破规模化应用瓶颈,核心在于Agentic ROI

本文第一作者为上海交通大学计算机学院副教授刘卫文,研究方向为大模型智能体,大语言模型,个性化算法等。 近年来,随着大语言模型的快速发展,基于其构建的大模型智能体(LLM Agents)正逐步从技术演示走向实际应用部署。 然而,真正实现规模化应用仍面临诸多瓶颈。
5/30/2025 3:53:27 PM

OpenAI 坚决反击马斯克:法院裁定请求毫无依据

据路透社报道,OpenAI 近日向法院提出申请,要求继续对特斯拉创始人埃隆・马斯克进行反诉。 OpenAI 在法庭文件中表示,马斯克请求驳回其反诉的动议 “毫无事实依据”。 这一案件的持续发酵,再次引发了公众的关注。
5/30/2025 3:00:54 PM
AI在线

Google 的 Agent2Agent(A2A)框架详解

作者 | Nirdiamant编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)MCP,市面上已经有不少干货解读了,但作为经常被拿来对比的 A2A,内容却很少,今天为大家详细解读下 A2A 的架构。 想象你走进一个繁忙的办公室,才华横溢的专家们正在处理各类复杂项目。 一个角落里,研究分析师在挖掘数据;旁边,设计专家在绘制视觉方案;另一边,物流协调员在安排货运。
5/30/2025 2:59:36 PM
云昭

苹果联合推出 AI 交错推理方法,Qwen2.5 模型响应速度快 80%、准确率提高 19.3%

苹果公司携手杜克大学,提出交错推理(Interleaved Reasoning)的全新强化学习(Reinforcement learning,RL)方法,进一步提升大语言模型的推理能力。
5/30/2025 2:45:12 PM
故渊

Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑

Anthropic 昨日(5 月 29 日)发布博文,宣布推出“电路追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。
5/30/2025 2:36:15 PM
故渊

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

用AI生成&编辑图片时,想生成一套完整故事模板,结果主角「变脸」比翻书还快,这可怎么办? 别慌,全新图像模型FLUX.1 Kontext来了! 支持上下文内图像生成,可以同时使用文本和图像进行提示,并能够无缝提取和修改视觉概念,从而生成新的、连贯的图像。
5/30/2025 2:28:10 PM
新智元

谷歌联合创始人谢尔盖・布林:AI 颠覆搜索,从导航工具升级为洞见提供者

在最新访谈节目中,谷歌联合创始人谢尔盖・布林(Sergey Brin)分享了对未来人工智能(AI)的观点,他认为 AI 彻底改变在线搜索,从根本上改变“搜索”的定义。
5/30/2025 2:23:52 PM
故渊

AI生图大洗牌!流匹配架构颠覆传统,一个模型同时接受文本和图像输入

AI生图新突破! 一个模型同时接受文本和图像输入。 新模型FLUX.1 Kontext使用流匹配架构(Flow Matching),不再是文本编码器和扩散模型各干各的,与此前技术都不同。
5/30/2025 2:22:00 PM

AI“电老虎”:2025 年底预估占全球数据中心近 50% 用电量,首超加密货币挖矿

科技媒体 The Verge 今天(5 月 30 日)发布博文,报道称最新研究预测,到 2025 年年底,人工智能(AI)的能源消耗将首次超过比特币挖矿,所消耗电力占全球数据中心近一半。
5/30/2025 2:10:05 PM
故渊

Hugging Face 推出 HopeJR 和 Reachy Mini 两款开源人形机器人

科技媒体 TechCrunch 昨日(5 月 29 日)发布博文,报道称 AI 开发平台 Hugging Face 最新推出 HopeJR 和 Reachy Mini 两款开源人形机器人,进一步进军机器人领域。
5/30/2025 1:37:43 PM
故渊

Salesforce 以 80 亿美元收购 Informatica,助力 AI 发展

Salesforce,这家云软件巨头,最近宣布了一项重磅收购交易,计划以80亿美元的价格收购数据管理公司 Informatica。 这笔交易的价格较 Informatica 一年前的市场价值下降了27%,显示出两家公司在增长放缓的背景下重新谈判的必要性。 自从 Salesforce 去年推出其人工智能产品 Agentforce 以来,AI 行业的竞争愈发激烈,时间的紧迫感让这项收购显得尤为重要。
5/30/2025 12:00:54 PM
AI在线

​未来五年,AI 可能取代一半入门级白领工作

在最近的一次采访中,Anthropic 公司的首席执行官达里奥・阿莫代伊(Dario Amodei)发出了一个引人注目的警告。 他表示,随着人工智能(AI)技术的快速发展,未来五年内,可能会有一半的入门级白领工作被取代,而失业率则可能飙升至10% 到20%。 阿莫代伊强调,许多工人并没有意识到这种变化即将到来,很多人对此感到难以置信。
5/30/2025 11:00:54 AM
AI在线

OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞

安全专家 Sean Heelan 于 5 月 22 日发布博文,报道称在 OpenAI 的 o3 推理模型帮助下,他成功发现了 Linux 内核重大漏洞,追踪编号为 CVE-2025-37899。
5/30/2025 10:39:45 AM
故渊

Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程

近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。 5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。 这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。
5/30/2025 10:01:14 AM
AI在线

视频推理界的“福尔摩斯测试”:所有大模型,统统不及格 | 论文代码开源

一个新的Benchmark,竟让大模型在复杂视频推理这事儿上统统不及格! 这就是腾讯ARC Lab和香港城市大学最新推出的Video-Holmes——如其名,它可以说是视频推理界的“福尔摩斯测试”,通过让多模态大模型参与“推理杀人凶手”, “解析作案意图”等高难度的推理任务,以展现他们复杂视频推理能力的边界。 而且Video-Holmes可以说是规避了现在业内已有的Benchmark痛点,即视频源和问题都偏简单,没法反映推理模型和非推理模型之间的差距。
5/30/2025 9:17:00 AM

博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工

有个叫Zochi的AI系统写了一篇研究论文,并且被顶级学术会议ACL 2025的主会场接受了! ACL是自然语言处理(NLP)领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体,就像一个从头到尾完成科学研究「AI科学家」。
5/30/2025 9:15:00 AM

视频实时生成可交互! 两位自动驾驶大牛创业世界模型:40毫秒/帧,无需任何游戏引擎,人人免费可玩

李飞飞押注的世界模型领域,迎来两位自动驾驶大牛创业新成果! 无需任何游戏引擎,AI能以40毫秒/帧想象并实时生成视频。 40毫秒/帧啥概念?
5/30/2025 9:14:00 AM

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

想象一下:你和AI聊天时,每句话都要等它3秒——血压是不是瞬间飙升? 低延迟LLM推理,就是专门针对这个问题的解决办法。 博客地址:「整了个大活」:他们手搓了个叫做「Megakernel」超级玩具(推理引擎),把Llama-1B的前向传播整个塞进单个GPU内核!
5/30/2025 9:12:00 AM