理论

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

论文的一些巧思1. 人开车其实并没有最优解，请问如何确定学习时的参考数据呢?开车其实也是多种多样的，然后你模仿学习本质上就是告诉他你只能这样做，你做了别的那个mass loss还会惩罚他。其实就是我们说的，我们其实就不能通过模仿来做。

3/18/2025 10:29:48 AM 自动驾驶之心

LLM核心损失函数深度剖析——KL散度与交叉熵损失

在深度学习和机器学习领域，损失函数是模型优化的核心工具之一。它不仅决定了模型的训练方向，还直接影响模型的性能和泛化能力。随着大语言模型（LLM）的兴起，对损失函数的理解和应用变得更加重要。

3/18/2025 10:28:32 AM Goldma

ChatGPT创始成员、后训练负责人官宣离职！自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走！这次是后训练负责人、研究副总裁 William Fedus。今天凌晨，Fedus 在 X 上发表了一则公开离职信，讲述了他离职的原因以及今后的去向。

3/18/2025 9:26:22 AM 机器之心

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

大模型同样的上下文窗口，只需一半内存就能实现，而且精度无损？前苹果ASIC架构师Nils Graef，和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。它以标准多头注意力（MHA）为基准，对其中的value缓存处理过程进行了调整，实现了更少的内存占用。

3/18/2025 9:23:22 AM 量子位

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

超低成本图像生成预训练方案来了——仅需8张GPU训练，就能实现近SOTA的高质量图像生成效果。划重点：开源。模型名为LightGen，由港科大Harry Yang团队联合Everlyn AI等机构打造，借助知识蒸馏（KD）和直接偏好优化（DPO）策略，有效压缩了大规模图像生成模型的训练流程。

3/18/2025 9:21:31 AM 量子位

陶哲轩：o3-mini纠正了我一个数学错误，十分钟解决原本一小时才能完成的题目

大模型持续震惊科学家！以往一小时才能完成的代码，现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。

3/18/2025 9:19:26 AM 量子位

一文读懂：模型上下文协议（MCP）

Hello folks，我是 Luga，今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型上下文协议（MCP）。随着人工智能迈向更复杂的应用场景，单一模型的局限性逐渐显现，而多模型协同与上下文感知的需求日益迫切。从对话系统需要理解用户的历史语境，到跨模态任务要求无缝整合文本、图像等多源数据，AI 的发展正呼唤一种全新的协作范式。

3/18/2025 9:10:00 AM 架构驿站

技术领导者如何利用AI克服十大采购挑战

然而，软件采购决策通常需要三到六个月——甚至更长时间——才能最终确定。在科技领域，这简直是漫长无比;等到交易签署时，市场条件可能已经改变，新的竞争对手已经出现，或者解决方案本身已经升级。难怪北美90%的IT高管认为软件采购和供应商选择是一个痛点。

3/18/2025 9:00:00 AM D1net编译

刚刚，o1/o3后训练掌门人出走创业，OpenAI鼎力支持押注AI材料！曾师从Bengio

OpenAI又痛失一员大将。刚刚，后训练副总William Fedus官宣离职OpenAI，将创办一家AI发现材料创业公司。对此OpenAI表示：「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。

3/18/2025 8:58:13 AM 新智元

CAIO正在脱颖而出不再在CIO帐下听令

2016年，AI领域最著名的研究者之一安德鲁·吴(Andrew Ng)撰写了关于在公司中设立首席AI官角色的好处，以及这一角色应具备的特点和职责的文章。当时，这一想法似乎有些牵强，认为除了少数特定行业之外，其他企业也需要设立CAIO。但近年来，随着GenAI的兴起，智能工具的使用量增加，CAIO角色已逐渐成为众多行业关键的技术高管职位。

3/18/2025 8:30:00 AM Ramos

豆包文生图技术报告发布！数据处理、预训练、RLHF全流程公开

今天，豆包大模型团队正式发布文生图技术报告，首次公开 Seedream 2.0 图像生成模型技术细节，覆盖数据构建、预训练框架、后训练 RLHF 全流程。该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现，进行了具体介绍。本文将呈现其中精华内容，报告完整版可通过下方链接获取：技术展示页：： Seedream 2.0 于 2024 年 12 月初在豆包 APP 和即梦上线，已服务上亿 C 端用户，并成为国内许多专业设计师辅助创作的首选模型。

3/18/2025 8:00:00 AM 豆包大模型团队

实战攻略：使用KubeMQ简化多LLM集成流程

译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战，各类不同API及通信协议的协同处理，以及如何确保请求路由的复杂性难题往往令人望而生畏。好在可以使用消息代理与路由机制更优雅地解决此类问题，在解决痛点的同时实现多个关键优势。本文将向大家介绍具体操作步骤。

3/18/2025 8:00:00 AM 核子可乐

DeepSeek 开源 3FS，一个文件系统而已，有啥值得吹的？

有人说，deepseek一个搞AI的公司，不干正事，开源一个文件系统，有啥值得吹的。今天来简单聊聊3FS，包懂。 3FS是什么?3FS，Fire-Flyer File System，是一个用C 写的高性能分布式文件系统。

3/18/2025 7:40:00 AM 架构师之路

AAAI 2025｜Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

在大模型浪潮的推动下，企业和个人的数据安全面临前所未有的挑战。抖音集团安全研究团队推出Portcullis ——针对大模型的隐私保护网关，旨在为第三方大型语言模型（LLM）推理服务提供可控可信的隐私防护。该工作成果《Portcullis : A Scalable and Verifiable Privacy Gateway for Third-Party LLM Inference》已被人工智能领域的顶级会议AAAI 2025以Oral报告的形式接收。

3/18/2025 7:00:00 AM 安全研究团队

突发！百川智能两位联合创始人出走，一位正在走离职手续

出品 | 51CTO技术栈（微信号：blog51cto）刚刚收到消息，大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。其中，联合创始人焦可已经离职，另一位联合创始人陈炜鹏也将离职，目前还在走内部流程。另据知情人士称，焦可和陈炜鹏两人都已经分别开始AI领域的创业。

3/17/2025 3:59:19 PM

无需训练即可定制分子生成：全新多模态引导框架TFG-Flow登上ICLR 2025

编辑丨ScienceAI在药物研发和材料科学领域，设计具有特定性质的分子是一项关键但耗时的任务。传统方法依赖大量实验试错，而生成式 AI 模型的出现为这一领域带来曙光。然而，现有方法面临两大瓶颈：一是多数生成模型仅能处理连续型数据（如图像像素），难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据；二是针对特定性质的定向生成通常需要额外训练模型，成本高昂。

3/17/2025 3:08:00 PM ScienceAI

2025年99%代码AI生成！OpenAI高管宣告没有退路，人类将被全面超越

「2025年底，99%的编码将实现AI自动化」！图片这是OpenAI首席产品官Kevin Weil在最新一期采访中，向全世界发出的郑重宣告。他大胆预测，今年是人工智能在编程方面，永远超越人类的一年，我们已经没有退路了。

3/17/2025 1:51:06 PM 新智元

提前免费！百度一口气上线文心4.5和X1!实力震惊硅谷！API价格又打下来了，R1还得对半砍！实测首款“有工具箱”的推理模型！

编辑 |伊风、言征出品 | 51CTO技术栈（微信号：blog51cto）百度的步伐也是加速了！原本计划4月1日免费的文心大模型4.5，在两周年之际就提前登场。不仅如此，3月16日，百度搞了个“两连发”，一口气开放了两款模型文心大模型4.5和文心大模型X1。

3/17/2025 1:45:25 PM 伊风

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品后悔没早发现！教你用谷歌Gemini生成精美PPT（附提示词） GGUF 是什么？一文看懂大模型里最火的模型格式 Sora、可灵、即梦哪家强？AI视频软件深度测评！ OmniParser V2 在 Windows 系统上的详细安装与运行指南

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉

理论

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

LLM核心损失函数深度剖析——KL散度与交叉熵损失

ChatGPT创始成员、后训练负责人官宣离职！自立门户并将获OpenAI投资

新注意力让大模型上下文内存占用砍半！精度不减还能加速2倍

8张GPU训出近SOTA模型，超低成本图像生成预训练方案开源

陶哲轩：o3-mini纠正了我一个数学错误，十分钟解决原本一小时才能完成的题目

一文读懂：模型上下文协议（MCP）

技术领导者如何利用AI克服十大采购挑战

刚刚，o1/o3后训练掌门人出走创业，OpenAI鼎力支持押注AI材料！曾师从Bengio

CAIO正在脱颖而出 不再在CIO帐下听令

豆包文生图技术报告发布！数据处理、预训练、RLHF全流程公开

实战攻略：使用KubeMQ简化多LLM集成流程

DeepSeek 开源 3FS，一个文件系统而已，有啥值得吹的？

AAAI 2025｜Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

突发！百川智能两位联合创始人出走，一位正在走离职手续

无需训练即可定制分子生成：全新多模态引导框架TFG-Flow登上ICLR 2025

2025年99%代码AI生成！OpenAI高管宣告没有退路，人类将被全面超越

提前免费！百度一口气上线文心4.5和X1!实力震惊硅谷！API价格又打下来了，R1还得对半砍！实测首款“有工具箱”的推理模型！

CAIO正在脱颖而出不再在CIO帐下听令