AI在线 AI在线

技术

你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
7/2/2025 8:46:00 AM

RAG搭建个人LLM知识库助手,很多人第一步就走错了...

基于RAG技术搭建本地知识库问答助手,已经是相当普遍的应用方案了。 前一阵我在公司实践过,用我们过往积累的、对业务重要的内部知识构建知识库,开发了一个智能问答Agent,能减少团队一部分的答疑时间。 构建知识库时,我们将内部知识整理成了 MarkDown 格式。
7/1/2025 2:22:00 AM
渡码

小扎挖走四名顶尖华人震惊Sam Altman,OpenAI最新内部全员信:奉陪到底,薪资大调整

昨天爆出小扎挖走OpenAI四名华人顶尖研发领导,果然是挖到了OpenAI的大动脉,震惊了整个OpenAI,现在Sam Altman 已经焦头烂额了,正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信,承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道:“我现在有一种发自肺腑的感觉,就好像有人闯进了我们的家,偷走了我们的东西。
6/30/2025 8:55:13 AM

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM

携程机票前端Web流式通信SSE全链路应用实践

作者简介Chris Xia,携程前端开发专家,关注新技术革新和研发效率提升。 本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。 深入探讨 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
6/24/2025 9:51:47 AM
Chris Xia

哈啰、蚂蚁、宁德时代联手成立造父智能,聚焦L4级自动驾驶

今日,哈啰、蚂蚁集团、以及宁德时代通过其投资主体,在上海共同注册成立了“上海造父智能科技有限公司”。 这家新公司注册资金高达12.88亿元人民币,将专注于L4级自动驾驶技术的研发、安全应用及商业化落地。 新公司的股权结构显示,上海云玚企业管理咨询有限公司(蚂蚁集团)、上海钧哈网络科技有限公司(哈啰)、以及宁波梅山保税港区问鼎投资有限公司(宁德时代)共同持股,三方首期合计出资已超过30亿元人民币。
6/23/2025 6:00:39 PM
AI在线

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。 第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究,致力于揭示其内部机制与 “思维” 过程。 通讯作者为新泽西理工学院的杜梦楠教授。
6/23/2025 9:08:00 AM

谷歌Gemini 2.5全线爆发!勇战「濒死恐慌」,却被丝血宝可梦吓到当场宕机

昨夜,Gemini 2.5全家桶三款模型,正式上线。 Gemini 2.5 Pro (正式版,与0605预览版相比无明显变化)  Gemini 2.5 Flash(正式版,与0520预览版相比定价有变)  Gemini 2.5 Flash-Lite(预览版,最小推理模型)这次,Gemini 2.5 Flash和Gemini 2.5 Pro正式版上线,与谷歌I/O大会公布的预览版性能无明显变化。 2.5 Flash-Lite预览版则是速度最快、性价比最高的Gemini 2.5系模型。
6/18/2025 2:18:23 PM

MIT工科生跨界AI,独作论文登Nature:只需3.5小时修复600年前名画

MIT理工男跨界艺术,一不小心就以一篇独作论文登上Nature? 由他设计的AI算法,将原本需要数月/数年才能搞定的名画修复工作,极限压缩至几小时。 Alex Kachkine,打破画作修复只能对原作数字扫描品进行“缝缝补补”的传统艺能,提出一种“以数字方式修复一幅画,并在物理上实现效果”的全新方法。
6/17/2025 8:50:00 AM

比马斯克Neuralink工艺更先进!我国成功开展首例侵入式脑机接口临床试验

用意念操控万物的“脑机接口”,就这样离我们更近了? 据央妈最新报道,我国已成功开展首例侵入式脑机接口临床试验——一位因意外事故导致四肢截肢的男子,现在仅凭意念就能玩五子棋游戏、发短信等等。 这项研究由中国科学院脑科学与智能技术卓越创新中心,联合复旦大学附属华山医院以及相关企业合作完成。
6/16/2025 9:00:00 AM

RAG:2025年检索增强生成前沿技术完全指南

一、RAG技术的核心突破与行业影响在生成式人工智能爆发的今天,检索增强生成(Retrieval-Augmented Generation, RAG)正以其独特的技术架构,成为连接静态知识库与动态生成能力的桥梁。 这项诞生于2020年的创新技术,通过将信息检索(Retrieval)与文本生成(Generation)解耦又融合的设计,突破了传统语言模型“幻觉”问题的桎梏,为构建可信、可控、可扩展的AI系统奠定了基础。 根据Gartner最新报告,2024年全球已有45%的企业在智能客服、数据分析等场景中部署RAG系统,预计到2025年这一比例将突破68%。
6/13/2025 2:25:00 AM
大模型之路

让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计

芯片设计向来是科技界的「皇冠明珠」,传统设计流程需要顶尖专家团队耗时数月甚至数年攻坚,极具挑战性。 芯片设计包含多个关键步骤,硬件设计方面包括逻辑设计、电路设计、物理设计等,基础软件方面包括操作系统内核设计、编译工具链设计、高性能库设计等。 中国科学院计算技术研究所处理器芯片全国重点实验室,联合中国科学院软件研究所,基于大模型等AI技术,推出处理器芯片和相关基础软件全自动设计系统——「启蒙」。
6/11/2025 9:07:00 AM

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。 其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。 但是,在华为,昇腾万卡算力集群,已经可以做到近乎“永不罢工”了:训练可用度达98%:这就好比你开着一辆车,全年365天里,有358天无论刮风下雨都能一脚油门就出发,从不掉链子,有问题可以随时检修,几乎不会耽误你的任何行程。
6/10/2025 4:36:29 PM

顶会0篇,一夜RLHF爆文刷屏!他靠写作逆袭AI圈,院士都说好

Ai2的高级研究科学家Nathan Lambert,最近分享了他如何走上AI之路。 尽管起步艰难、几经波折,他依旧在AI领域站稳脚跟、有所成就。 博士毕业时,他没有在NeurIPS/ICML/ICLR等顶会上发表过文章。
6/9/2025 9:00:00 AM

八个数据集全面胜出!思维链推理刷新图学习表现上限

思维链提示学习来了! 由于图数据拥有复杂的非线性结构和缺少文本信息,语言模型中的思维链(Chain-of-Thought,CoT)提示学习方法难以简单直接地应用于图数据。 基于此,来自新加坡管理大学和中国科学技术大学的研究者们提出了GCoT——首个应用于无文本图数据的类思维链提示学习框架。
6/9/2025 8:37:00 AM

“一代更比一代强”:现代 RAG 架构的演进之路

基于 RAG(检索增强生成)的 AI 系统,过去是,现在仍然是企业利用大语言模型(LLM)的最有价值的应用之一。 我记得差不多两年前我写了第一篇关于 RAG 的文章,那时候这个术语还未被广泛采用。 我当时描述的是一个以最基础方式实现的 RAG 系统。
6/6/2025 1:15:00 AM
Baihai IDP

AI Agent落地面临的三大挑战

前面为大家介绍过AI Agent的发展史和工程结构模型,并对Agent的典型代表——Manus的技术架构进行了详细解析。 不少同学看完后纷纷留言说,他们在工作中也尝试在推动落地Agent,但结果总是不尽如意,希望我能给出一些建议。 我自己目前对AI Agent也处在探索实践阶段,并无法给出很好的建议。
6/5/2025 1:55:00 AM
写文章老张

冲击自回归,扩散模型正在改写下一代通用模型范式

上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。 在这其中,Gemini Diffusion 绝对算是最让人兴奋的进步之一。 从名字看得出来,这是一个采用了扩散模型的 AI 模型,而这个模型却并非我们通常看到的扩散式视觉生成模型,而是一个地地道道的语言模型!
6/4/2025 1:55:03 PM