AI在线 AI在线

理论

OpenAI自爆:GPT-4.5 并非前沿模型!奥特曼称OpenAI的GPU已用光,还透露了一个“转型”思路?

编辑 | 伊风"GPT-4.5 并非前沿模型,但它是OpenAI最大的 LLM,比 GPT-4 的计算效率提高了 10 倍以上"。  图片这句话就这么水灵灵地出现在GPT-4.5官方给的System Card(系统卡)中。 ,竟然等来一句“不是前沿模型”这么让人失望的话。
2/28/2025 1:01:06 PM
伊风

DeepSeek太给力了!自家的大模型秘方开源到底!国产大模型雄起

出品 | 51CTO技术栈(微信号:blog51cto)DeepSeek “开源周”第五天,依旧保持了一如既往地“务实”风,满满的诚意。 先来回忆下前四天,源神的慷慨发布——第一天,2月24日,最为外界称道的MLA技术率先开源,这项解码加速器FlashMLA技术能够让英伟达Hopper架构GPU跑得更快,效果更好! 紧接着,25日,直接亮出首个面向MoE模型的开源专家并行通信库DeepEP,实现了MoE训练推理的全栈优化;第三天,则进一步祭出一项跨时代的发布:FP8通用矩阵乘法加速库,从底层让模型训练、微调变得更加流畅丝滑;第四天,也就是昨天的并行优化“三剑客”:DeepSeek-V3和R1 模型背后的并行计算优化技术——DualPipe(双向流水线并行算法,让计算和通信高效协同)、EPLB ( 专家并行负载均衡器,让每个 GPU 都“雨露均沾”)、profile-data (性能分析数据,可以理解成V3/R1 的并行优化的分析经验)可以说前四天的发布聚焦在算力通信、模型架构优化,也就是算力和算法的层面,而接下来第五天的开源则补上了AI三驾马车的最后一块,也是用户体验感知更为明显的一块优化动作:高性能分布式文件系统(数据存储层面的改进)。
2/28/2025 12:32:42 PM

DeepSeek开源周最后一天:让数据处理「从自行车升级到高铁」

DeepSeek 的开源周终于迎来了最后一天。 今天他们开源了一个名为 3FS(Fire-Flyer File System)的系统。 这是一种并行文件系统,它利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的全部带宽,能够加速和推动 DeepSeek 平台上所有数据访问操作。
2/28/2025 10:36:25 AM
机器之心

81%的美国人对AI说“不”:科技圈的“打脸”时刻?

在科技巨头们纷纷砸下重金布局人工智能的时代,你有没有想过,那些身处职场的美国上班族们,到底有没有把AI用起来呢? 最近,皮尤研究中心的一项调查给出了答案:大多数美国人,其实还在AI的门外徘徊。 这项调查在2024年10月进行,涵盖了5273名美国在职成年人。
2/28/2025 10:16:13 AM
舒云

不同神经网络之间的区别,仅仅只是网络结构的不同,明白了这个你才能知道应该怎么学习神经网络

在学习神经网络技术的过程中,会有多种不同的神经网络架构;如常见的RNN,CNN等;因此,我们很多人都会被这些乱七八糟的神经网络架构给迷惑住,即想学习神经网络又不知道应该怎么入手;面对各种各样的网络模型,也不知道应该去学习哪种。 但是,我们从问题的最本质出发,不同的神经网络唯一的区别就是网络结构的不同;之所以有多种神经网络模型的原因就在于不同的网络架构能够完成不同的任务。 比如,RNN适合文本处理,机器翻译;CNN适合图像处理等。
2/28/2025 10:02:34 AM
AI探索时代

DeepSeek 开源进度 5/5:高性能并行文件系统 3FS 实现聚合吞吐 6.6 TiB/s

2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File . System),这是一个专为充分利用现代 SSD 和 RDMA . 网络带宽而设计的并行文件系统,具备惊人的数据访问性能,为深度学习等数据密集型应用提供了强大的支持。
2/28/2025 10:01:06 AM
故渊

AI未来的机遇与潜力在哪?世界经济论坛联合埃森哲、毕马威发布权威报告

随着科技浪潮的奔涌向前,人工智能(AI)已从前沿概念深度融入社会经济的方方面面,成为推动产业变革与创新发展的核心力量。 在这样的时代背景下,世界经济论坛(WEF)联合埃森哲、毕马威发布报告,无疑为我们洞察 AI 未来的发展脉络提供了权威视角。 该报告汇聚了多方智慧,通过深入的行业调研、前沿的技术分析以及对全球趋势的精准把握,为我们全方位呈现 AI 在未来的机遇与潜力。
2/28/2025 9:50:00 AM
新智元

加速度计成本暴降1/400!哈工大首次突破精度、量程瓶颈|AAAI 2025 Oral

低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。 为此,哈尔滨工业大学的研究人员提出HEROS-GAN,首次通过生成式深度学习将低成本加速度计信号映射为高成本等效信号,突破其精度与量程瓶颈。 目前,论文已被顶会AAAI 2025接收为Oral,具有一定的理论价值和启发性。
2/28/2025 9:40:00 AM
新智元

语音合成也遵循Scaling Law,太乙真人“原声放送”讲解论文 | 港科大等开源

活久见,太乙真人给讲论文了噻! 咳咳,诸位道友且听我一番唠叨。 老道我闭关数日,所得一篇妙诀,便是此Llasa之法。
2/28/2025 9:30:00 AM
量子位

疯了!居然有人试图让我搞懂,什么是 DeepGEMM

DeepSeek开源周,继DeepEP之后,开源了第三弹DeepGEMM。 今天简单来说说:吃瓜:DeepGMEE是干嘛的? 技术:DeepGMEE是怎么做到的?
2/28/2025 9:30:00 AM
58沈剑

DeepSeek-R1自写CUDA内核跑分屠榜!斯坦福学霸狂飙GPU编程自动化挑战人类

近日,来自斯坦福和普林斯顿的研究者发现,DeepSeek-R1已经能生成自定义CUDA内核了,而且还在一众推理模型中,直接拿下了TOP 1! 紧随其后,OpenAI o1和Claude 3.5 Sonnet分别排第二和第三。 具体过程,就是给定一个PyTorch程序,让模型对其优化,然后生成一个包含自定义CUDA内核的PyTorch版本。
2/28/2025 9:22:00 AM
新智元

机器人8小时速成物流分拣员!Figure-02大规模上岗只用30天

好家伙! 机器人已入厂打工分拣快递,手法娴熟和人类一模一样。 前几天,Figure推出了端到端通用控制模型——Helix,能让机器人像人一样感知、理解和行动。
2/28/2025 9:20:00 AM
量子位

大模型训练或无需“纯净数据”!北大团队新研究:随机噪声影响有限,新方法让模型更抗噪

传统的大语言模型训练需要依赖”纯净数据”——那些经过仔细筛选、符合标准语法且逻辑严密的文本。 但如果这种严格的数据过滤,并不像我们想象中那般重要呢? 这就像教孩子学语言:传统观点认为他们应该只听语法完美的标准发音。
2/28/2025 9:15:00 AM
量子位

Grok 3疯狂实测,满屏都是马斯克!3D乒乓球破屏,火星殖民实时播报

各位坐稳了,AI的世界开始变得疯狂起来了! 自从上周马斯克发布Grok 3以来,其热度一直不减。 它可不仅仅是另一个聊天机器人,这家伙正在扭曲现实!
2/28/2025 9:07:00 AM
新智元

DeepSeek“出圈”了,鹅厂人怎么看?

话题背景在人工智能领域,大型语言模型的快速发展引发了无数关于技术革新和未来趋势的讨论。 随着各类AI技术的不断突破,越来越多的创新模型开始崭露头角,而最近备受关注的DeepSeek更是成为了热议的焦点。 它被一些人称为“AI技术的重大突破”,甚至被认为是下一代人工智能发展的重要方向。
2/28/2025 9:00:00 AM
腾讯技术工程

Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友

公认的编程开发能力第一! Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。 大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。
2/28/2025 9:00:00 AM
量子位

任意Prompt就能给大模型实时排名!竞技场新玩法,还能自动找最佳AI来作答

给大模型排名这事儿,现在有了新玩法——任意输入一个Prompt,就能给大模型们实时排名,精准找到最适合做这个Prompt的大模型! 这就是竞技场(lmarena.ai)最新推出的排名方式,叫做Prompt-to-leaderboard(P2L)。 主打的就是找到最能直击你Prompt“灵魂”的那款大模型。
2/28/2025 8:40:00 AM
量子位

3500元,人形机器人1:1复刻人类动作 | 上海AI Lab开源新成果

《环太平洋》名场面之“用真人操纵机甲”,如今照进现实了。 话不多说,请看VCR:原来,这是上海AI Lab最新推出的人形机器人“驾驶舱”——HOMIE(Humanoid Loco-Manipulation with Isomorphic Exoskeleton Cockpit) 。 一副机械臂外骨骼、一双动作感应手套,以及一块三轴脚踏板,人们就能对双足人形机器人全身进行精准遥操作了。
2/28/2025 8:30:00 AM
量子位