AI在线 AI在线

技术

突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%

告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
7/25/2025 9:24:43 AM

面试官:聊聊RAG的执行流程?

RAG、MCP 和 FunctionCall 等都是 AI 的核心技术,同时也是面试中最长问的知识点,那么今天就来看下:RAG 技术及其执行流程。 概述RAG(Retrieval-Augmented Generation,检索增强生成)是指在将原始问题发送给大语言模型之前,先通过外部知识库将数据进行注入,之后先在知识库中检索相关信息,然后再将检索结果和原始问题一起发送给大模型组织、整理答案的一种技术手段。 通过这种实现方式,大语言模型可以获取到特定领域的相关信息,并能够利用这些信息进行回复,从而降低了发生幻觉的可能性。
7/25/2025 1:45:00 AM
磊哥

突发!特朗普刚刚发布《美国AI计划》,OpenAI、微软、亚马逊成大赢家

今天凌晨,美国白宫官网消息,特朗普公布了《美国AI行动计划》,以保证美国毫无争议地成为全球AI霸主。 该计划主要有三大支柱,加速AI创新、构建AI基础设施以及主导国际外交与安全,涵盖90多项具体行政命令。 其中,废除限制AI创新监管条例,加速发电场、水资源、半导体芯片等基础设施建设,这对于像OpenAI、微软、亚马逊、谷歌、Meta等AI巨头来说非常有利。
7/24/2025 9:15:06 AM

官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

ChatGPT Agent的技术内幕,被官方披露了。 就在OpenAI官方推出其最强智能体后,外界褒与贬的热议都没停过……但不论如何,都被视为智能体方向上标志性的一步,是OpenAI一个全新的开端。 关于更进一步的Agent Mode的工作原理,OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析,还回答了几个值得关注的问题。
7/24/2025 9:05:00 AM

突然发疯!人形格斗冠军机器人凌空回旋踢,架子都干翻,现场研究员:0.0?

一条人形机器人发疯的视频在网上火了,视频中快递盒子乱飞,场面一度十分抓马。 研究人员:希望是一场幻觉。 视频中“发疯”的机器人是今年机器人格斗的美国冠军DeREK(原型为宇树机器人G1),而抱着头的这位,是该机器人团队REKrobot的CEO兼机器人格斗手Cix。
7/24/2025 8:52:00 AM

9岁女孩靠AI「万能钥匙」赚到第一桶金!OpenAI新CEO的六大野心

Fidji Simo将于8月18日出任OpenAI应用CEO,管理公司至少三分之一的业务,推广和拓展AI的应用场景。 她是一位务实的技术迷,相信AI会给人类带来前所未有的机会,赋予个人前所未有的力量。 每一次技术革命都像一把双刃剑:它能让更多人拥有决策力、塑造世界的能力,甚至以全新方式掌握自己的命运。
7/23/2025 9:07:00 AM

并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM

《AI 2027》揭秘:人类会被超级智能取代吗?等等,还有另一个结局!

2021年,Daniel Cocotal团队发布了一份研究报告《AI 2027》。 他以超前且精准的预测闻名,成为了洞悉AI未来发展方向的先驱。 那时ChatGPT还没问世,Daniel就准确预测了聊天机器人的崛起、耗资1亿美元的AI训练项目,以及对AI芯片的出口管制。
7/21/2025 9:15:00 AM

离职员工首次长文揭秘真实的OpenAI:一半是天才,一半是疯子,7周时间上线code x

本文是OpenAI离职员工Calvin French-Owen在OpenAI工作一年的回忆与反思感悟。 作者从OpenAI的企业文化,技术栈揭秘,以及在OpenAI用7天时间打造编程代理code x 的故事,让我们首次得以窥见OpenAI内部,非常值得一看。 我在OpenAI一年的反思与感悟作者:Calvin French-Owen日期:2025年7月15日三周前,我离开了OpenAI。
7/17/2025 9:25:53 AM

马斯克的Neuralink梦想成真?意识连续谱理论震惊科学界!

马斯克Neuralink野心理论上被证实! Michael Levin探讨了意识与自我组装的关系,强调意识是一个连续谱系。 Levin是美国著名的发育生物学家和合成生物学家,近期,他在采访中深入探讨了意识和自我组织的关系,聚焦于生物和人工系统。
7/16/2025 1:14:13 PM

Switch的救世主是老黄!?

Switch2发售后,内置图形API——NVN2首次公开亮相。 相较前代Switch发热、卡顿、续航短、画质缩水等问题,搭载英伟达NVN2的Switch2显然从容得多,面对各类3A大作也毫不吃力。 《赛博朋克2077》的联合开发者Eoin O'Grady表示,只要是Xbox上能跑满60帧的游戏,移植到Switch2几乎都不在话下。
7/15/2025 4:26:44 PM

你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
7/2/2025 8:46:00 AM

RAG搭建个人LLM知识库助手,很多人第一步就走错了...

基于RAG技术搭建本地知识库问答助手,已经是相当普遍的应用方案了。 前一阵我在公司实践过,用我们过往积累的、对业务重要的内部知识构建知识库,开发了一个智能问答Agent,能减少团队一部分的答疑时间。 构建知识库时,我们将内部知识整理成了 MarkDown 格式。
7/1/2025 2:22:00 AM
渡码

小扎挖走四名顶尖华人震惊Sam Altman,OpenAI最新内部全员信:奉陪到底,薪资大调整

昨天爆出小扎挖走OpenAI四名华人顶尖研发领导,果然是挖到了OpenAI的大动脉,震惊了整个OpenAI,现在Sam Altman 已经焦头烂额了,正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信,承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道:“我现在有一种发自肺腑的感觉,就好像有人闯进了我们的家,偷走了我们的东西。
6/30/2025 8:55:13 AM

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM

携程机票前端Web流式通信SSE全链路应用实践

作者简介Chris Xia,携程前端开发专家,关注新技术革新和研发效率提升。 本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。 深入探讨 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
6/24/2025 9:51:47 AM
Chris Xia

哈啰、蚂蚁、宁德时代联手成立造父智能,聚焦L4级自动驾驶

今日,哈啰、蚂蚁集团、以及宁德时代通过其投资主体,在上海共同注册成立了“上海造父智能科技有限公司”。 这家新公司注册资金高达12.88亿元人民币,将专注于L4级自动驾驶技术的研发、安全应用及商业化落地。 新公司的股权结构显示,上海云玚企业管理咨询有限公司(蚂蚁集团)、上海钧哈网络科技有限公司(哈啰)、以及宁波梅山保税港区问鼎投资有限公司(宁德时代)共同持股,三方首期合计出资已超过30亿元人民币。
6/23/2025 6:00:39 PM
AI在线

大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了

作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。 第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究,致力于揭示其内部机制与 “思维” 过程。 通讯作者为新泽西理工学院的杜梦楠教授。
6/23/2025 9:08:00 AM