数据

万物皆可高斯！清华最新GaussianAD：以高斯为中心的端到端自动驾驶，完爆当前SOTA！

写在前面 & 笔者的个人理解基于视觉的自动驾驶因其令人满意的性能和低成本而显示出巨大的潜力。大多数现有方法采用密集表示（如鸟瞰图）或稀疏表示（如实例框）进行决策，这会在全面性和效率之间进行权衡。本文探索了一个以高斯为中心的端到端自动驾驶（GaussianAD）框架，并利用3D语义高斯来广泛而稀疏地描述场景。

12/18/2024 10:30:00 AM Wenzhao Zheng等

Omni-Scene：Gaussian统一表征下的自动驾驶多模态生成新SOTA！

写在前面 & 笔者的个人理解西湖大学和浙大的工作，利用3DGS的统一表征，结合扩散模型打通自动驾驶场景的多模态生成。近期生成重建的算法越来越多，这说明单重建或者单生成可能都没有办法很好的cover闭环仿真，所以现在的工作尝试两者结合，这块应该也是后面闭环仿真落地的方向。先前采用基于像素的高斯表示的工作已经证明了前馈稀疏视图重建的有效性。

12/18/2024 9:34:13 AM Dongxu Wei等

人工智能的过去、现在和未来

人工智能改变我们工作方式的潜力是无穷的，但我们距离这一目标还有很长的路要走，需要仔细的规划和考虑。人工智能 (AI) 的持续扩张速度是前所未有的，特别是自 2022 年 GenAI 进入市场以来。如今，人工智能的工作速度远远快于人类的产出，这也是这项技术对专注于精简运营、提高生产率和成本效率的领导者如此有吸引力的原因。

12/18/2024 7:45:18 AM 铸盾安全

张璇、周光敏团队在随机退役条件下基于生成式学习的电池健康状态评估与可持续回收研究中取得新进展

编辑丨ScienceAI随着电动汽车市场的快速发展，动力电池需求量激增，但其设计寿命有限，退役潮已经到来。如何高效、经济、环保地处理这些退役电池，成为亟待解决的挑战。梯次利用和回收利用被视为关键途径，而准确评估退役电池健康状态（SOH）则是实现这一目标的基础。

12/17/2024 11:59:00 AM ScienceAI

清华本科生获NeurIPS Math-AI 杰出论文奖：REBASE算法让小模型实现推理大突破

刚刚由清华大学本科生伍垟圳为一作的论文《推理Scaling Laws：面向语言模型问题求解的计算最优推理实证分析》在顶级AI学术会议NeurIPS 2024 Math-AI上荣获杰出论文奖（Outstanding Paper Award）。这项研究不仅刷新了人们对推理阶段计算优化的理解，还为如何在有限计算资源下实现更高效的大语言模型（LLM）推理提供了全新的思路论文亮点：推理阶段的计算优化新突破1. 小模型也能打败大模型：重新定义推理阶段的效率论文系统性地研究了不同模型大小和推理策略在固定计算预算下的表现，发现小模型（如Llemma-7B）在结合高级推理算法后，能够实现比大模型（如Llemma-34B）更优的成本性能平衡。

12/17/2024 11:30:00 AM AI寒武纪

Bengio参与的首个《AI安全指数报告》出炉，最高分仅C、国内一家公司上榜

图片安全话题，在人工智能（AI）行业一向备受关注。尤其是诸如 GPT-4 这样的大语言模型（LLM）出现后，有不少业内专家呼吁「立即暂停训练比 GPT-4 更强大的人工智能模型」，包括马斯克在内的数千人纷纷起身支持，联名签署了一封公开信。这封公开信便来自生命未来研究所（Future of Life Institute），该机构由麻省理工学院教授、物理学家、人工智能科学家、《生命 3.0》作者 Max Tegmark 等人联合创立，是最早关注人工智能安全问题的机构之一，其使命为 “引导变革性技术造福生活，避免极端的大规模风险”。

12/16/2024 2:20:00 PM 机器之心

NeurIPS神仙打架：李飞飞180页PPT谈视觉智能，Bengio同OpenAI员工吵架，何恺明谈AI宿命论

12/13/2024 3:00:00 PM 量子位

再也不怕显存爆炸了！高效重建「几何精准」的大规模复杂三维场景，中科院提出CityGaussianV2

三维场景重建旨在基于围绕目标场景拍摄的一组图像恢复出场景的三维结构，其核心追求是精准的几何结构以及逼真的图像渲染。随着近两年的发展，3D Gaussian Splatting（3DGS）因其训练和渲染效率上的优势逐渐成为该领域的主流算法。这一技术使用一组离散的高斯椭球来表示场景，并使用高度优化的光栅器进行渲染。

12/13/2024 1:00:00 PM 新智元

扩散模型=流匹配？谷歌DeepMind博客深度详解这种惊人的等价性

扩散模型和流匹配实际上是同一个概念的两种不同表达方式吗？从表面上看，这两种方法似乎各有侧重：扩散模型专注于通过迭代的方式逐步去除噪声，将数据还原成清晰的样本。而流匹配则侧重于构建可逆变换系统，目标是学习如何将简单的基础分布精确地映射到真实数据分布。

12/13/2024 12:07:15 PM 机器之心

反转！Claude 3.5超大杯没有训练失败，最新爆料：内部自留，用于合成数据和RL训练

传闻反转了，Claude 3.5 Opus没有训练失败。只是Anthropic训练好了，暗中压住不公开。 semianalysis分析师爆料，Claude 3.5超大杯被藏起来，只用于内部数据合成以及强化学习奖励建模。

12/12/2024 2:10:00 PM 量子位

一周发明GAN！时间检验奖得主分享背后故事：每件发明都不是最后的发明

引用超85000次的经典论文GAN获NeurIPS2024时间检验奖后，它的起源和背后故事也被抛了出来。要从Yoshua Bengio实验室的一次头脑风暴说起。 Bengio召集实验室成员，提出了一个富有挑战性的设想：训练一个确定性的生成网络g，该网络仅在输入z中包含随机噪声。

12/11/2024 2:10:00 PM 量子位

数据不够？Meta刚刚发布的Llama 3.3正好拿来搞定！

编辑 | 言征出品 | 51CTO技术栈（微信号：blog51cto）7日凌晨，Meta 推出了 Llama 3.3。虽然参数没有太高，只有700亿参数，但与之前开源的Llama 3.1 4050亿参数模型性能相当，而推理、部署成本却降低了很多。例如，输入成本降低了10倍，输出成本降低了近5倍。

12/9/2024 5:32:37 PM 言征

白话告诉你大模型到底是怎么工作的

图片本文转载自微信公众号「程序反思录」，作者程序反思录。转载本文请联系程序反思录公众号。前言2022年底“大模型”在国内突然遍地开花，不管你身处什么行业，都或多或少听说或使用过大模型相关的工具，也听说过大模型训练是一件超级烧钱的事情。

12/9/2024 9:55:25 AM 程序反思录

陶哲轩对谈OpenAI高管：AI也能做数据稀疏推理，“也许很快OpenAI就能证明陶哲轩是错的”

“也许很快OpenAI将能证明陶哲轩是错的。 ”好家伙！隔着屏幕都能闻到“硝烟”味了(bu shi~事情是这样的。

12/9/2024 9:35:00 AM 量子位

快速学会一个算法，卷积神经网络！！！

今天给大家分享一个强大的算法模型，卷积神经网络。卷积神经网络（CNN）是一类专门用于处理具有网格结构数据（如图像）的深度学习模型，广泛应用于图像处理、计算机视觉等领域。 CNN 通过模仿生物视觉系统的结构，通过层级化的卷积和池化操作，自动从输入数据中提取特征并进行分类或回归。

12/4/2024 10:33:17 AM 程序员小寒

Andrej Karpathy 首次公开私人邮件：揭秘Transformer 注意力机制真相

近年来，Transformer 成为深度学习领域的绝对主角，而支撑其核心的“注意力”机制更是掀起了一场革命。但这项改变 AI 格局的技术究竟是如何诞生的？ Andrej Karpathy 分享了与“注意力”机制最初开发者 Dzmitry Bahdanau 的私人邮件，首次披露了这段被误解和简化的历史。

12/4/2024 9:25:00 AM

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命

在实际应用中，数据集的数据分布往往随着时间而不断变化，预测模型需要持续更新以保持准确性。时域泛化旨在预测未来数据分布，从而提前更新模型，使模型与数据同步变化。然而，传统方法假设领域数据在固定时间间隔内收集，忽视了现实任务中数据集采集的随机性和不定时性，无法应对数据分布在连续时间上的变化。

12/2/2024 2:35:01 PM

谷歌推出 Caravan MultiMet，利用各种气象数据增强水文预报

编辑 | KX大样本水文学致力于解决紧迫的全球挑战，例如气候变化、洪水预测和水资源管理。通过利用不同地区的大量水文和气象信息数据集，研究人员开发了预测与水有关的现象的模型。这有助于保护社区和生态系统免受与水有关的挑战。

11/28/2024 3:08:00 PM ScienceAI

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 大语言模型字节跳动 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉