技术
突破单token预测局限!南洋理工首次将多token预测引入微调,编程任务准确率提升11.67%
告别Next-token,现在模型微调阶段就能直接多token预测! 从GPT到Claude,当前主流LLM都依赖next-token prediction(下一token预测)进行训练,但它却让AI很难真正理解跨越多token的完整概念。 于是南洋理工大学最近提出了一项新技术——概念感知微调(CAFT),首次实现将multi-token prediction(多token预测)引入微调阶段,让模型能够像人类一样理解和学习完整概念。
7/25/2025 9:24:43 AM
面试官:聊聊RAG的执行流程?
RAG、MCP 和 FunctionCall 等都是 AI 的核心技术,同时也是面试中最长问的知识点,那么今天就来看下:RAG 技术及其执行流程。 概述RAG(Retrieval-Augmented Generation,检索增强生成)是指在将原始问题发送给大语言模型之前,先通过外部知识库将数据进行注入,之后先在知识库中检索相关信息,然后再将检索结果和原始问题一起发送给大模型组织、整理答案的一种技术手段。 通过这种实现方式,大语言模型可以获取到特定领域的相关信息,并能够利用这些信息进行回复,从而降低了发生幻觉的可能性。
7/25/2025 1:45:00 AM
磊哥
突发!特朗普刚刚发布《美国AI计划》,OpenAI、微软、亚马逊成大赢家
今天凌晨,美国白宫官网消息,特朗普公布了《美国AI行动计划》,以保证美国毫无争议地成为全球AI霸主。 该计划主要有三大支柱,加速AI创新、构建AI基础设施以及主导国际外交与安全,涵盖90多项具体行政命令。 其中,废除限制AI创新监管条例,加速发电场、水资源、半导体芯片等基础设施建设,这对于像OpenAI、微软、亚马逊、谷歌、Meta等AI巨头来说非常有利。
7/24/2025 9:15:06 AM
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
ChatGPT Agent的技术内幕,被官方披露了。 就在OpenAI官方推出其最强智能体后,外界褒与贬的热议都没停过……但不论如何,都被视为智能体方向上标志性的一步,是OpenAI一个全新的开端。 关于更进一步的Agent Mode的工作原理,OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析,还回答了几个值得关注的问题。
7/24/2025 9:05:00 AM
突然发疯!人形格斗冠军机器人凌空回旋踢,架子都干翻,现场研究员:0.0?
一条人形机器人发疯的视频在网上火了,视频中快递盒子乱飞,场面一度十分抓马。 研究人员:希望是一场幻觉。 视频中“发疯”的机器人是今年机器人格斗的美国冠军DeREK(原型为宇树机器人G1),而抱着头的这位,是该机器人团队REKrobot的CEO兼机器人格斗手Cix。
7/24/2025 8:52:00 AM
9岁女孩靠AI「万能钥匙」赚到第一桶金!OpenAI新CEO的六大野心
Fidji Simo将于8月18日出任OpenAI应用CEO,管理公司至少三分之一的业务,推广和拓展AI的应用场景。 她是一位务实的技术迷,相信AI会给人类带来前所未有的机会,赋予个人前所未有的力量。 每一次技术革命都像一把双刃剑:它能让更多人拥有决策力、塑造世界的能力,甚至以全新方式掌握自己的命运。
7/23/2025 9:07:00 AM
并行革命,32倍吞吐量跃升!英伟达Helix架构突破百万Token推理瓶颈
想象一个使用大模型的任务,需要一次处理百万字符的文档,例如从百科全书中获取信息,或是分析数百页的法律卷宗,异或追踪持续数月的对话记录,都需要越来越长的上下文。 而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。 反复读取这个缓存会消耗GPU内存带宽。
7/22/2025 10:40:00 AM
《AI 2027》揭秘:人类会被超级智能取代吗?等等,还有另一个结局!
2021年,Daniel Cocotal团队发布了一份研究报告《AI 2027》。 他以超前且精准的预测闻名,成为了洞悉AI未来发展方向的先驱。 那时ChatGPT还没问世,Daniel就准确预测了聊天机器人的崛起、耗资1亿美元的AI训练项目,以及对AI芯片的出口管制。
7/21/2025 9:15:00 AM
离职员工首次长文揭秘真实的OpenAI:一半是天才,一半是疯子,7周时间上线code x
本文是OpenAI离职员工Calvin French-Owen在OpenAI工作一年的回忆与反思感悟。 作者从OpenAI的企业文化,技术栈揭秘,以及在OpenAI用7天时间打造编程代理code x 的故事,让我们首次得以窥见OpenAI内部,非常值得一看。 我在OpenAI一年的反思与感悟作者:Calvin French-Owen日期:2025年7月15日三周前,我离开了OpenAI。
7/17/2025 9:25:53 AM
马斯克的Neuralink梦想成真?意识连续谱理论震惊科学界!
马斯克Neuralink野心理论上被证实! Michael Levin探讨了意识与自我组装的关系,强调意识是一个连续谱系。 Levin是美国著名的发育生物学家和合成生物学家,近期,他在采访中深入探讨了意识和自我组织的关系,聚焦于生物和人工系统。
7/16/2025 1:14:13 PM
Switch的救世主是老黄!?
Switch2发售后,内置图形API——NVN2首次公开亮相。 相较前代Switch发热、卡顿、续航短、画质缩水等问题,搭载英伟达NVN2的Switch2显然从容得多,面对各类3A大作也毫不吃力。 《赛博朋克2077》的联合开发者Eoin O'Grady表示,只要是Xbox上能跑满60帧的游戏,移植到Switch2几乎都不在话下。
7/15/2025 4:26:44 PM
你的Agent电脑助手正在踩雷!最新研究揭秘Computer-Use Agent的安全漏洞
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。 主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。 通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。
7/2/2025 8:46:00 AM
RAG搭建个人LLM知识库助手,很多人第一步就走错了...
基于RAG技术搭建本地知识库问答助手,已经是相当普遍的应用方案了。 前一阵我在公司实践过,用我们过往积累的、对业务重要的内部知识构建知识库,开发了一个智能问答Agent,能减少团队一部分的答疑时间。 构建知识库时,我们将内部知识整理成了 MarkDown 格式。
7/1/2025 2:22:00 AM
渡码
小扎挖走四名顶尖华人震惊Sam Altman,OpenAI最新内部全员信:奉陪到底,薪资大调整
昨天爆出小扎挖走OpenAI四名华人顶尖研发领导,果然是挖到了OpenAI的大动脉,震惊了整个OpenAI,现在Sam Altman 已经焦头烂额了,正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信,承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道:“我现在有一种发自肺腑的感觉,就好像有人闯进了我们的家,偷走了我们的东西。
6/30/2025 8:55:13 AM
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR
余天予,清华大学计算机系一年级博士生,导师为清华大学自然语言处理实验室刘知远副教授。 研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习,在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文,谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward,基于可验证奖励的强化学习)的巨大潜力。
6/27/2025 10:10:43 AM
携程机票前端Web流式通信SSE全链路应用实践
作者简介Chris Xia,携程前端开发专家,关注新技术革新和研发效率提升。 本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。 深入探讨 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
6/24/2025 9:51:47 AM
Chris Xia
哈啰、蚂蚁、宁德时代联手成立造父智能,聚焦L4级自动驾驶
今日,哈啰、蚂蚁集团、以及宁德时代通过其投资主体,在上海共同注册成立了“上海造父智能科技有限公司”。 这家新公司注册资金高达12.88亿元人民币,将专注于L4级自动驾驶技术的研发、安全应用及商业化落地。 新公司的股权结构显示,上海云玚企业管理咨询有限公司(蚂蚁集团)、上海钧哈网络科技有限公司(哈啰)、以及宁波梅山保税港区问鼎投资有限公司(宁德时代)共同持股,三方首期合计出资已超过30亿元人民币。
6/23/2025 6:00:39 PM
AI在线
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
作者介绍:本篇文章的作者团队来自美国四所知名高校:西北大学、乔治亚大学、新泽西理工学院和乔治梅森大学。 第一作者束东与共同第一作者吴烜圣、赵海燕分别是上述高校的博士生,长期致力于大语言模型的可解释性研究,致力于揭示其内部机制与 “思维” 过程。 通讯作者为新泽西理工学院的杜梦楠教授。
6/23/2025 9:08:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
腾讯
Stable Diffusion
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
百度
RAG
Sora
具身智能
工具
GPU
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
视觉
预测
Transformer
编程
生成式AI
伟达
AI模型
特斯拉
Copilot