AI在线 AI在线

GPU

阿里云GPU用量削减82%的技术突破:Aegaeon计算池化方案深度解析

1192个GPU削减到213个,82%的用量削减——当我看到阿里云Aegaeon系统在三个月测试中的这个数据时,第一反应是这怎么可能? 要知道,这可是在服务数十个720亿参数大模型的情况下实现的。 按照现在H20 GPU的价格,这意味着硬件成本直接砍掉了80%以上。
10/23/2025 9:19:43 AM
阿丸笔记

DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”

DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。 3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。
10/21/2025 8:03:21 AM

Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law

在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。 但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale? scale 什么是有价值的?
10/20/2025 9:05:00 AM

实锤了:GPU越多,论文接收率越高、引用越多

在过去三年里,AI 领域取得了显著进步,这一飞跃主要得益于基础模型的发展。 这些模型在大规模多模态数据上进行训练,并在公开发布后取得了巨大成功。 然而,基础模型的研究需要大量的数据、算力和人力资源。
10/17/2025 4:40:00 PM
机器之心

前董事长罕见曝OpenAI的“痛苦与困境”:我们正走向计算稀缺世界!内部GPU分配如玩俄罗斯方块,Sora2实为被削弱的原始模型

编辑 | 听雨“我们正走向一个计算极度稀缺的世界,而能源将是下一个巨大的瓶颈。 ”“未来,所有的授权都会变成‘角色扮演’授权。 ”“我们希望能建立可以自主思考一年、甚至十年的AI。
10/14/2025 2:43:11 PM
听雨

刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈

过去一年,OpenAI在算力上斥资70亿美元。 其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。 图片可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。
10/11/2025 10:34:49 AM
新智元

如何在 LLM 推理中战胜不确定性

最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载,这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性,随后文章还给出了具体的解决方案。 在详细介绍文章的内容之前,我们先来说一下thinkingmachines这家公司。 它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。
9/28/2025 1:25:00 AM
技不辱你

一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍

大家一直在担心:AI越来越烧钱,ChatGPT的订阅费会不会年年涨? 更让人头疼的,是用AI时越来越容易卡顿、掉链子。 罪魁祸首,其实是芯片过热。
9/24/2025 1:07:28 PM

英伟达重金收购 AI 初创公司 Enfabrica CEO 及核心团队

近日,英伟达宣布了一项重大的收购交易,以超过9亿美元的现金和股票购买了 AI 硬件初创公司 Enfabrica 的首席执行官 Rochan Sankar 及其核心团队,同时获得了该公司的技术许可。 这一交易的完成标志着英伟达在 AI 领域的进一步布局,特别是在提升其 GPU 连接能力方面。 图源备注:图片由AI生成,图片授权服务商MidjourneyEnfabrica 成立于2019年,专注于开发能够将超过10万块 GPU 高效连接的技术,这一核心技术被认为可以帮助英伟达构建更为高效的一体化系统,使得大规模的计算集群能够像单台计算机一样运行。
9/19/2025 11:11:57 AM
AI在线

微软用「光」跑AI登上Nature!100倍能效颠覆GPU,华人首席研究员扛鼎

过去的几十年,各大公司都在芯片上暗暗较劲:芯片涨价、GPU短缺、AI算力焦虑...就在大家盯着芯片迭代升级时,微软在悄悄做另一件事:用光重新定义计算。 他们花了四年,用手机摄像头、Micro LED和透镜,拼出了一台模拟光学计算机(AOC)。 如今,这个实验已经登上Nature,带来了一个足以颠覆GPU的未来想象。
9/15/2025 9:15:00 AM

​报道称:OpenAI 与博通合作开发自家 AI 芯片,明年开始量产

OpenAI 正在与美国芯片制造商博通合作,计划在明年推出自家的人工智能(AI)芯片。 这一举动是 OpenAI 在行业内寻求独立于第三方半导体公司的重要一步。 根据《金融时报》的报道,这款新型图形处理单元(GPU)将专门用于 OpenAI 的内部用途,而不会对外销售。
9/9/2025 11:15:23 AM
AI在线

一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)

在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔

AI工厂:国产GPU的算力进化

训练大模型,有点像炼丹。 而算力,就是炼丹炉里的柴。 只有炉火纯青,才能真正炼出好丹。
8/13/2025 11:40:30 AM
小枣君

马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖

马斯克昨天在X上发了一条消息:"xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100,这什么概念? 我算了一下,这相当于35个核电站的发电量才能供得起。
7/25/2025 9:25:05 AM
阿丸笔记

惊到了!大神炮轰CUDA:CUDA存致命缺陷,它不是未来!这种新语言将打破英伟达的GPU垄断地位,护城河终会消失!

编辑 | 云昭CUDA一直被视为英伟达GPU的最强壁垒,让许多业界的玩家望洋兴叹。 但,今天这篇文章会给各位习惯C 、CUDA开发的大佬提个醒:有一种新的编程语言,正在AI圈兴起,撬动英伟达的围墙花园。 而CUDA也不再是护城河。
7/21/2025 12:53:30 PM
云昭

老黄再收95后华人才俊!4亿美元收购AI初创公司

鹭羽 白交 发自 凹非寺. 量子位 | 公众号 QbitAI又一家95后华人AI初创,被老黄收购! 仅四亿美金的收购金额,就把员工全部打包带回英伟达。
7/6/2025 2:10:12 PM
鹭羽

刚刚,Ilya官宣出任SSI CEO!送走「叛徒」联创,豪言不缺GPU

小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的CEO。
7/4/2025 8:33:30 AM
新智元

韩国计划未来5年在人工智能领域投入16万亿韩元

据媒体报道,韩联社援引韩国科技部向总统国政规划委员会报告的计划称,韩国政府将在未来 5 年内在人工智能领域投入16. 1 万亿韩元。 保障 5 万颗GPU安全供应,打造AI数据中心。
6/18/2025 3:02:15 PM
AI在线