数据

新基准！威斯康星大学开源Ultra-AV：统一自动驾驶纵向轨迹数据集

摘要自动驾驶车辆在交通运输领域展现出巨大潜力，而理解其纵向驾驶行为是实现安全高效自动驾驶的关键。现有的开源AV轨迹数据集在数据精炼、可靠性和完整性方面存在不足，从而限制了有效的性能度量分析和模型开发。本研究针对这些挑战，构建了一个（Ultra-AV），用于分析自动驾驶汽车的微观纵向驾驶行为。

2/12/2025 10:30:00 AM

Hang Zhou等

检测&OCC双SOTA！Doracamom实现首个LV多模态融合的统一多任务感知算法框架~

写在前面&笔者的个人理解自动驾驶技术是现代交通革命的前沿，备受关注。自动驾驶系统通常包括环境感知、轨迹预测和规划控制等组件，以实现自动驾驶功能。准确的 3D 感知是自动驾驶系统的基础，主要侧重于 3D目标检测和语义占用预测任务。

2/12/2025 10:20:00 AM

自动驾驶之心

Claude团队：用400万条对话分析AI对经济的长期影响

基于400万条Claude真实对话数据，Anthropic重磅发布全新报告！在今天，哪些职业用AI最多？他们都用AI干什么？

2/12/2025 9:10:00 AM

量子位

20个很强的DeepSeek提问公式

大家好，我是汤师爷~今天直接给大家分享DeepSeek干货内容。要获得精准的AI回答，关键在于提问方式。这里为你整理了20个高效提问公式，直接提升回答质量。

2/12/2025 8:54:54 AM

架构师汤师爷

4500美元复刻DeepSeek神话，1.5B战胜o1-preview只用RL！训练细节全公开

强化学习迎来重大突破！近日，来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B，通过简单的强化学习（RL）微调，得到了全新的DeepScaleR-1.5B-Preview。在AIME2024基准中，模型的Pass@1准确率达高达43.1% ——不仅比基础模型提高了14.3%，而且在只有1.5B参数的情况下超越了OpenAI o1-preview！

2/11/2025 4:17:42 PM

新智元

Claude 4要来了？Anthropic发布38页经济指数报告，43%人类工作正被AI取代！

Claude 3.5 Opus无了，Anthropic本周可能会提前放出Claude 4。网友爆料称，除了Claude 4，还有推理模型也将首亮相，评分全面超越o3。 Anthropic已经沉寂太久了，去年曾被传出内部模型研发受阻。

2/11/2025 1:00:00 PM

新智元

本科生推翻姚期智40年前的猜想，哈希表的平均查询时间竟与填满程度无关

1985 年，著名计算机科学家、图灵奖得主姚期智提出了一个与哈希表有关的猜想。现在，40 年过去了，一名本科生却成功推翻了这个猜想。而这项成就却源自一个始于 2021 年秋的故事。

2/11/2025 11:17:30 AM

机器之心

港大字节最新视频生成模型刷屏！网友直接RIP市场营销，Sora也不香了

刚刚，港大字节联手发布最新视频生成模型，让歪果网友直呼疯狂。有人甚至直接RIP市场营销、TikTok用户和YouTube创作者。你敢信，下面这一幕不是来自欧巴电视剧，而是AI生成的！

2/11/2025 9:00:00 AM

量子位

马克龙豪掷1090亿开欧洲「星际之门」，Mistral狂飙登顶法国APP榜首！

就在刚刚，Le Chat登顶法国免费APP榜首！在效率榜中，ChatGPT屈居第二，DeepSeek仅排第三在美国效率榜排名35（ChatGPT第一，DeepSeek第二）欧洲开发者们一片欢腾：恭喜Mistral AI，让欧洲的AI竞赛中终于（在欧洲）有了一席之地。之前，不管是OpenAI还是DeepSeek，都光芒太盛。

2/10/2025 12:00:25 PM

新智元

谷歌AlphaGeometry2攻克IMO几何难题，已超越金牌得主平均水准

OpenAI 与 DeepSeek 卷得不可开交的时候，谷歌 DeepMind 的数学推理模型又偷偷惊艳了所有人。在最新的一篇论文中，谷歌 DeepMind 介绍了全新进化的 AlphaGeometry 2，该系统在解决奥林匹克几何问题方面已经超过了金牌得主的平均水准。论文标题：Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2论文链接：（IMO）是一项面向全球高中生的著名数学竞赛。

2/10/2025 9:10:00 AM

机器之心

谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

谷歌DeepMind最新数学AI，一举解决了2000-2024年IMO竞赛中84%的几何问题。 AlphaGeometry2论文发布，在总共50道题中完成了42道，相比去年的一代多完成了15道。作为对比，纯语言模型OpenAI o1和Gemini Flash Thinking一道都解决不了。

2/8/2025 2:00:00 PM

量子位

免费功能卷翻付费版ChatGPT，欧洲AI新贵叫板OpenAI

“欧洲OpenAI”Mistral AI有新动作了！ Le Chat（法语“猫”）全新升级，官方自称它是“您生活和工作的终极AI助手”。从今天开始，Le Chat上线移动端，iOS和Android都支持，不久也将对企业私有基础设施开放。

2/8/2025 8:50:00 AM

量子位

英伟达联手MIT清北发布SANA 1.5！线性扩散Transformer再刷文生图新SOTA

近年来，文本生成图像的技术不断突破，但随着模型规模的扩大，计算成本也随之急剧上升。为此，英伟达联合MIT、清华、北大等机构的研究人员提出了一种高效可扩展的线性扩散Transformer——SANA，在大幅降低计算需求的情况下，还能保持有竞争力的性能。 SANA1.5在此基础上，聚焦了两个关键问题：线性扩散Transformer的可扩展性如何？

2/7/2025 2:01:20 PM

新智元

轨迹预测新基准！清华开源Ultra-AV：统一自动驾驶纵向轨迹数据集

2/7/2025 10:17:55 AM

Hang Zhou等

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

OpenAI o系列模型为何性能如此强大？ OpenAI将他们的方法描述为使用大规模强化学习（RL），暗示使用了大量的数据。最近大火的DeepSeek-R1模型也通过使用数百万个样本和多个训练阶段使用强化学习的方式，成功地达到了o1级别的性能。

2/6/2025 2:28:16 PM

新智元

【RAG】RAG范式演进及Agentic-RAG总结综述

RAG的核心思想是通过实时数据检索弥补这一缺陷——在生成答案前，系统先从外部数据源（如数据库、API或互联网）动态检索相关上下文，再结合LLM的知识生成更精准、实时的响应。但它们通常在处理动态、多步推理任务、适应性和复杂工作流的协调方面仍然存在不足。 rag三大组件检索器（Retriever）：从外部数据源（如向量数据库、知识图谱或网页）中搜索与查询相关的信息。

2/6/2025 1:50:06 PM

余俊晖

终结谷歌搜索！OpenAI免费开放ChatGPT搜索，无需注册

今天凌晨3点，OpenAI宣布向所有用户开放ChatGPT搜索功能，无需注册。与谷歌那种传统收录模式的搜索引擎相比，ChatGPT搜索可以更快抓取网络信息，能实现分钟级别的解析，这对于股票、体育、财经等，需要第一时间快速获取新闻内容的行业帮助非常大。同时借助大模型的能力，可以更好地解读用户的搜索想法，并且可以提供搜索结果的源地址。

2/6/2025 11:00:00 AM

AIGC开放社区

快手发布DragAnything，拖动锚点精准控制视频物体和镜头运动，视频运动控制技术革命性更新

快手联合浙江大学、新加坡国立大学发布了DragAnything ，利用实体表示实现对任何物体的运动控制。该技术可以精确控制物体的运动，包括前景、背景和相机等不同元素。该项目提供了对实体级别运动控制的新见解，通过实体表示揭示了像素级运动和实体级运动之间的差异。

2/5/2025 10:30:00 AM

AIGC Studio

资讯热榜

GPT-5发布即翻车！奥特曼深夜承认：图表出错，模型变笨。用户只想用回GPT-4o 2025 年多款 Deep Research 智能体框架全面对比 OpenAI夺金IOI，但输给3位中国高中生基于 DiT 大模型与字体级分割的视频字幕无痕擦除方案，助力短剧出海和GPT聊了21天，我差点成为陶哲轩扎克伯格看OpenAI直播挖人，北大校友孙之清加入Meta Meta刚刚开源DINOv3，横扫60+任务，无标注封神！ OpenAI重磅发布ChatGPT-5！写作坠入谷底，编程一骑绝尘

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT DeepSeek AI绘画谷歌机器人数据大模型 Midjourney 开源智能用户 Meta 微软 GPT 学习技术图像 Gemini 马斯克 AI创作智能体论文英伟达 Anthropic 代码算法训练 Stable Diffusion 芯片蛋白质开发者腾讯 LLM 生成式苹果 Claude Agent AI新词神经网络 3D AI for Science 机器学习研究生成 xAI 人形机器人 AI视频计算 Sora GPU AI设计百度华为工具大语言模型搜索具身智能场景 RAG 字节跳动大型语言模型预测深度学习伟达视觉 Transformer 视频生成 AGI 神器推荐亚马逊架构 Copilot DeepMind 应用安全