技术

告别大统一模型！预填充解码分离背后的技术哲学革命

说实话，最近看到一个技术思路的时候，我有点被震撼到了。我们一直觉得，既然大语言模型这么厉害，那就应该用一个统一的大模型来处理所有事情——输入理解、上下文处理、token生成，全都交给一个模型搞定。这听起来很符合"大力出奇迹"的思路。

7/31/2025 12:00:00 AM

阿丸笔记

国产AI新突破：Qwen思考166秒背后的技术野心

想象一下这个场景：你让AI画一只骑自行车的鹈鹕，其他模型可能会立刻给你一个结果，但有一个AI却开始了长达166秒的深度思考。它在想什么？鹈鹕的嘴巴应该怎么画？

7/28/2025 9:19:22 AM

阿丸笔记

港科大&北京人形提出LOVON：足式机器人开放世界全域目标追踪新范式！

本文一作彭道杰，香港科技大学广州在读博士生；共同一作曹嘉航，北京人形机器人创新中心实习生；共同一作张强香港科技大学广州在读博士生，北京人形机器人创新中心学术委员会主任；通讯导师马骏，香港科技大学广州&香港科技大学助理教授。在复杂的开放环境中，让足式机器人像人类一样自主完成「先跑到椅子旁，再快速接近行人」这类长程多目标任务，一直是 robotics 领域的棘手难题。传统方法要么局限于固定目标类别，要么难以应对运动中的视觉抖动、目标丢失等实时挑战，导致机器人在真实场景中常常「迷路」或「认错对象」。

7/25/2025 2:59:51 PM

突破单token预测局限！南洋理工首次将多token预测引入微调，编程任务准确率提升11.67%

告别Next-token，现在模型微调阶段就能直接多token预测！从GPT到Claude，当前主流LLM都依赖next-token prediction（下一token预测）进行训练，但它却让AI很难真正理解跨越多token的完整概念。于是南洋理工大学最近提出了一项新技术——概念感知微调（CAFT），首次实现将multi-token prediction（多token预测）引入微调阶段，让模型能够像人类一样理解和学习完整概念。

7/25/2025 9:24:43 AM

面试官：聊聊RAG的执行流程？

RAG、MCP 和 FunctionCall 等都是 AI 的核心技术，同时也是面试中最长问的知识点，那么今天就来看下：RAG 技术及其执行流程。概述RAG（Retrieval-Augmented Generation，检索增强生成）是指在将原始问题发送给大语言模型之前，先通过外部知识库将数据进行注入，之后先在知识库中检索相关信息，然后再将检索结果和原始问题一起发送给大模型组织、整理答案的一种技术手段。通过这种实现方式，大语言模型可以获取到特定领域的相关信息，并能够利用这些信息进行回复，从而降低了发生幻觉的可能性。

7/25/2025 1:45:00 AM

磊哥

突发！特朗普刚刚发布《美国AI计划》，OpenAI、微软、亚马逊成大赢家

今天凌晨，美国白宫官网消息，特朗普公布了《美国AI行动计划》，以保证美国毫无争议地成为全球AI霸主。该计划主要有三大支柱，加速AI创新、构建AI基础设施以及主导国际外交与安全，涵盖90多项具体行政命令。其中，废除限制AI创新监管条例，加速发电场、水资源、半导体芯片等基础设施建设，这对于像OpenAI、微软、亚马逊、谷歌、Meta等AI巨头来说非常有利。

7/24/2025 9:15:06 AM

官方揭秘ChatGPT Agent背后原理！通过强化学习让模型自主探索最佳工具组合

ChatGPT Agent的技术内幕，被官方披露了。就在OpenAI官方推出其最强智能体后，外界褒与贬的热议都没停过……但不论如何，都被视为智能体方向上标志性的一步，是OpenAI一个全新的开端。关于更进一步的Agent Mode的工作原理，OpenAI开发团队在和投资方红杉资本的圆桌谈话中做了详细解析，还回答了几个值得关注的问题。

7/24/2025 9:05:00 AM

突然发疯！人形格斗冠军机器人凌空回旋踢，架子都干翻，现场研究员：0.0？

一条人形机器人发疯的视频在网上火了，视频中快递盒子乱飞，场面一度十分抓马。研究人员：希望是一场幻觉。视频中“发疯”的机器人是今年机器人格斗的美国冠军DeREK（原型为宇树机器人G1），而抱着头的这位，是该机器人团队REKrobot的CEO兼机器人格斗手Cix。

7/24/2025 8:52:00 AM

9岁女孩靠AI「万能钥匙」赚到第一桶金！OpenAI新CEO的六大野心

Fidji Simo将于8月18日出任OpenAI应用CEO，管理公司至少三分之一的业务，推广和拓展AI的应用场景。她是一位务实的技术迷，相信AI会给人类带来前所未有的机会，赋予个人前所未有的力量。每一次技术革命都像一把双刃剑：它能让更多人拥有决策力、塑造世界的能力，甚至以全新方式掌握自己的命运。

7/23/2025 9:07:00 AM

并行革命，32倍吞吐量跃升！英伟达Helix架构突破百万Token推理瓶颈

想象一个使用大模型的任务，需要一次处理百万字符的文档，例如从百科全书中获取信息，或是分析数百页的法律卷宗，异或追踪持续数月的对话记录，都需要越来越长的上下文。而大模型生成的每个词都需要扫描存储在所谓的KV缓存中存储的过去标记。反复读取这个缓存会消耗GPU内存带宽。

7/22/2025 10:40:00 AM

《AI 2027》揭秘：人类会被超级智能取代吗？等等，还有另一个结局！

2021年，Daniel Cocotal团队发布了一份研究报告《AI 2027》。他以超前且精准的预测闻名，成为了洞悉AI未来发展方向的先驱。那时ChatGPT还没问世，Daniel就准确预测了聊天机器人的崛起、耗资1亿美元的AI训练项目，以及对AI芯片的出口管制。

7/21/2025 9:15:00 AM

离职员工首次长文揭秘真实的OpenAI：一半是天才，一半是疯子，7周时间上线code x

本文是OpenAI离职员工Calvin French-Owen在OpenAI工作一年的回忆与反思感悟。作者从OpenAI的企业文化，技术栈揭秘，以及在OpenAI用7天时间打造编程代理code x 的故事，让我们首次得以窥见OpenAI内部，非常值得一看。我在OpenAI一年的反思与感悟作者：Calvin French-Owen日期：2025年7月15日三周前，我离开了OpenAI。

7/17/2025 9:25:53 AM

马斯克的Neuralink梦想成真？意识连续谱理论震惊科学界！

马斯克Neuralink野心理论上被证实！ Michael Levin探讨了意识与自我组装的关系，强调意识是一个连续谱系。 Levin是美国著名的发育生物学家和合成生物学家，近期，他在采访中深入探讨了意识和自我组织的关系，聚焦于生物和人工系统。

7/16/2025 1:14:13 PM

Switch的救世主是老黄！？

Switch2发售后，内置图形API——NVN2首次公开亮相。相较前代Switch发热、卡顿、续航短、画质缩水等问题，搭载英伟达NVN2的Switch2显然从容得多，面对各类3A大作也毫不吃力。《赛博朋克2077》的联合开发者Eoin O'Grady表示，只要是Xbox上能跑满60帧的游戏，移植到Switch2几乎都不在话下。

7/15/2025 4:26:44 PM

你的Agent电脑助手正在踩雷！最新研究揭秘Computer-Use Agent的安全漏洞

本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。通讯作者为刘东瑞和邵婧，上海 AI Lab 安全团队，研究方向为 AI 安全可信。

7/2/2025 8:46:00 AM

RAG搭建个人LLM知识库助手，很多人第一步就走错了...

基于RAG技术搭建本地知识库问答助手，已经是相当普遍的应用方案了。前一阵我在公司实践过，用我们过往积累的、对业务重要的内部知识构建知识库，开发了一个智能问答Agent，能减少团队一部分的答疑时间。构建知识库时，我们将内部知识整理成了 MarkDown 格式。

7/1/2025 2:22:00 AM

渡码

小扎挖走四名顶尖华人震惊Sam Altman，OpenAI最新内部全员信：奉陪到底，薪资大调整

昨天爆出小扎挖走OpenAI四名华人顶尖研发领导，果然是挖到了OpenAI的大动脉，震惊了整个OpenAI，现在Sam Altman 已经焦头烂额了，正在全力应对。 OpenAI的首席研究官Mark Chen刚刚向全体员工发送了一封措辞强硬的全员信，承诺将在顶级研究人才的争夺战中与小扎正面交锋。 Mark Chen在信中写道：“我现在有一种发自肺腑的感觉，就好像有人闯进了我们的家，偷走了我们的东西。

6/30/2025 8:55:13 AM

突破通用领域推理的瓶颈！清华NLP实验室强化学习新研究RLPR

余天予，清华大学计算机系一年级博士生，导师为清华大学自然语言处理实验室刘知远副教授。研究兴趣主要包括高效多模态大模型、多模态大模型对齐和强化学习，在 CVPR、AAAI等人工智能领域的著名国际会议和期刊发表多篇学术论文，谷歌学术引用1000余次。 Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR（Reinforcement Learning with Verifiable Reward，基于可验证奖励的强化学习）的巨大潜力。

6/27/2025 10:10:43 AM

资讯热榜

GGUF 是什么？一文看懂大模型里最火的模型格式 AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月免费！让图片放大不失真的位图转矢量图神器 Tmttool 免注册免费用！17种AI绘图模型一站式体验平台LMArena Sora、可灵、即梦哪家强？AI视频软件深度测评！可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评 LangChain V1.0 深度解析：手把手带你跑通全新智能体架构深度拆解！这可能是全网最详细的AI视频创作教程

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek 谷歌 AI绘画大模型机器人数据 AI新词 Midjourney 开源 Meta 微软智能用户 GPT 学习技术智能体马斯克 Gemini Anthropic 英伟达图像 AI创作训练 LLM 论文代码算法苹果 AI for Science Agent Claude 腾讯芯片 Stable Diffusion 蛋白质开发者具身智能 xAI 生成式神经网络机器学习 3D AI视频人形机器人 RAG 大语言模型研究百度 Sora 生成 GPU 工具华为计算字节跳动 AGI 大型语言模型 AI设计搜索生成式AI 视频生成 DeepMind 特斯拉场景深度学习 AI模型架构亚马逊 Transformer MCP 编程视觉预测

技术