AI在线 AI在线

理论

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

深度解析以Decoder为核心的无BEV的大一统端到端架构 | 对话CCF-CV学术新锐奖贾萧松博士

论文的一些巧思1. 人开车其实并没有最优解,请问如何确定学习时的参考数据呢?开车其实也是多种多样的,然后你模仿学习本质上就是告诉他你只能这样做,你做了别的那个mass loss还会惩罚他。 其实就是我们说的,我们其实就不能通过模仿来做。
3/18/2025 10:29:48 AM 自动驾驶之心
LLM核心损失函数深度剖析——KL散度与交叉熵损失

LLM核心损失函数深度剖析——KL散度与交叉熵损失

在深度学习和机器学习领域,损失函数是模型优化的核心工具之一。 它不仅决定了模型的训练方向,还直接影响模型的性能和泛化能力。 随着大语言模型(LLM)的兴起,对损失函数的理解和应用变得更加重要。
3/18/2025 10:28:32 AM Goldma
ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

ChatGPT创始成员、后训练负责人官宣离职!自立门户并将获OpenAI投资

OpenAI 又有重量级员工出走! 这次是后训练负责人、研究副总裁 William Fedus。 今天凌晨,Fedus 在 X 上发表了一则公开离职信,讲述了他离职的原因以及今后的去向。
3/18/2025 9:26:22 AM 机器之心
新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

新注意力让大模型上下文内存占用砍半!精度不减还能加速2倍

大模型同样的上下文窗口,只需一半内存就能实现,而且精度无损? 前苹果ASIC架构师Nils Graef,和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。 它以标准多头注意力(MHA)为基准,对其中的value缓存处理过程进行了调整,实现了更少的内存占用。
3/18/2025 9:23:22 AM 量子位
8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源

8张GPU训出近SOTA模型,超低成本图像生成预训练方案开源

超低成本图像生成预训练方案来了——仅需8张GPU训练,就能实现近SOTA的高质量图像生成效果。 划重点:开源。 模型名为LightGen,由港科大Harry Yang团队联合Everlyn AI等机构打造,借助知识蒸馏(KD)和直接偏好优化(DPO)策略,有效压缩了大规模图像生成模型的训练流程。
3/18/2025 9:21:31 AM 量子位
陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM 量子位
一文读懂:模型上下文协议(MCP)

一文读懂:模型上下文协议(MCP)

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型上下文协议(MCP)。 随着人工智能迈向更复杂的应用场景,单一模型的局限性逐渐显现,而多模型协同与上下文感知的需求日益迫切。 从对话系统需要理解用户的历史语境,到跨模态任务要求无缝整合文本、图像等多源数据,AI 的发展正呼唤一种全新的协作范式。
3/18/2025 9:10:00 AM 架构驿站
技术领导者如何利用AI克服十大采购挑战

技术领导者如何利用AI克服十大采购挑战

然而,软件采购决策通常需要三到六个月——甚至更长时间——才能最终确定。 在科技领域,这简直是漫长无比;等到交易签署时,市场条件可能已经改变,新的竞争对手已经出现,或者解决方案本身已经升级。 难怪北美90%的IT高管认为软件采购和供应商选择是一个痛点。
3/18/2025 9:00:00 AM D1net编译
刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio

刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio

OpenAI又痛失一员大将。 刚刚,后训练副总William Fedus官宣离职OpenAI,将创办一家AI发现材料创业公司。 对此OpenAI表示:「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。
3/18/2025 8:58:13 AM 新智元
CAIO正在脱颖而出 不再在CIO帐下听令

CAIO正在脱颖而出 不再在CIO帐下听令

2016年,AI领域最著名的研究者之一安德鲁·吴(Andrew Ng)撰写了关于在公司中设立首席AI官角色的好处,以及这一角色应具备的特点和职责的文章。 当时,这一想法似乎有些牵强,认为除了少数特定行业之外,其他企业也需要设立CAIO。 但近年来,随着GenAI的兴起,智能工具的使用量增加,CAIO角色已逐渐成为众多行业关键的技术高管职位。
3/18/2025 8:30:00 AM Ramos
豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开

豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开

今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。 该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。 本文将呈现其中精华内容,报告完整版可通过下方链接获取:技术展示页:: Seedream 2.0 于 2024 年 12 月初在豆包 APP 和即梦上线,已服务上亿 C 端用户,并成为国内许多专业设计师辅助创作的首选模型。
3/18/2025 8:00:00 AM 豆包大模型团队
实战攻略:使用KubeMQ简化多LLM集成流程

实战攻略:使用KubeMQ简化多LLM集成流程

译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战,各类不同API及通信协议的协同处理,以及如何确保请求路由的复杂性难题往往令人望而生畏。 好在可以使用消息代理与路由机制更优雅地解决此类问题,在解决痛点的同时实现多个关键优势。 本文将向大家介绍具体操作步骤。
3/18/2025 8:00:00 AM 核子可乐
DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?

DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?

有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。 今天来简单聊聊3FS,包懂。 3FS是什么?3FS,Fire-Flyer File System,是一个用C 写的高性能分布式文件系统。
3/18/2025 7:40:00 AM 架构师之路
AAAI 2025|Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

AAAI 2025|Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

在大模型浪潮的推动下,企业和个人的数据安全面临前所未有的挑战。 抖音集团安全研究团队推出Portcullis ——针对大模型的隐私保护网关,旨在为第三方大型语言模型(LLM)推理服务提供可控可信的隐私防护。 该工作成果 《Portcullis : A Scalable and Verifiable Privacy Gateway for Third-Party LLM Inference》已被人工智能领域的顶级会议AAAI 2025以Oral报告的形式接收。
3/18/2025 7:00:00 AM 安全研究团队
突发!百川智能两位联合创始人出走,一位正在走离职手续

突发!百川智能两位联合创始人出走,一位正在走离职手续

出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM
无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
3/17/2025 3:08:00 PM ScienceAI
2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越

2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越

「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM 新智元
提前免费!百度一口气上线文心4.5和X1!实力震惊硅谷!API价格又打下来了,R1还得对半砍!实测首款“有工具箱”的推理模型!

提前免费!百度一口气上线文心4.5和X1!实力震惊硅谷!API价格又打下来了,R1还得对半砍!实测首款“有工具箱”的推理模型!

编辑 |伊风、言征出品 | 51CTO技术栈(微信号:blog51cto)百度的步伐也是加速了! 原本计划4月1日免费的文心大模型4.5,在两周年之际就提前登场。 不仅如此,3月16日,百度搞了个“两连发”,一口气开放了两款模型文心大模型4.5和文心大模型X1。
3/17/2025 1:45:25 PM 伊风