GPU

阿里云GPU用量削减82%的技术突破：Aegaeon计算池化方案深度解析

1192个GPU削减到213个，82%的用量削减——当我看到阿里云Aegaeon系统在三个月测试中的这个数据时，第一反应是这怎么可能？要知道，这可是在服务数十个720亿参数大模型的情况下实现的。按照现在H20 GPU的价格，这意味着硬件成本直接砍掉了80%以上。

10/23/2025 9:19:43 AM

阿丸笔记

DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”

DeepSeek最新开源的模型，已经被硅谷夸疯了！因为实在太DeepSeek了。 3B规模、指数级效能变革、大道至简，甚至被认为把谷歌Gemini严防死守的商业机密开源了。

10/21/2025 8:03:21 AM

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

在 LLM 领域，扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子，还有几个关键问题悬而未决：如何 scale？ scale 什么是有价值的？

10/20/2025 9:05:00 AM

实锤了：GPU越多，论文接收率越高、引用越多

在过去三年里，AI 领域取得了显著进步，这一飞跃主要得益于基础模型的发展。这些模型在大规模多模态数据上进行训练，并在公开发布后取得了巨大成功。然而，基础模型的研究需要大量的数据、算力和人力资源。

10/17/2025 4:40:00 PM

机器之心

前董事长罕见曝OpenAI的“痛苦与困境”：我们正走向计算稀缺世界！内部GPU分配如玩俄罗斯方块，Sora2实为被削弱的原始模型

编辑 | 听雨“我们正走向一个计算极度稀缺的世界，而能源将是下一个巨大的瓶颈。 ”“未来，所有的授权都会变成‘角色扮演’授权。 ”“我们希望能建立可以自主思考一年、甚至十年的AI。

10/14/2025 2:43:11 PM

听雨

刚刚，全球首个GB300巨兽救场！一年烧光70亿，OpenAI内斗GPU惨烈

过去一年，OpenAI在算力上斥资70亿美元。其中，大模型研发占了最大头——50亿美元，而推理计算仅用了20亿美元。图片可见，LLM训练正吞噬无尽的算力，这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。

10/11/2025 10:34:49 AM

新智元

如何在 LLM 推理中战胜不确定性

最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载，这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性，随后文章还给出了具体的解决方案。在详细介绍文章的内容之前，我们先来说一下thinkingmachines这家公司。它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。

9/28/2025 1:25:00 AM

技不辱你

一年4次迭代，狂堆GPU成真！微软AI冷液灌芯，散热暴涨3倍

大家一直在担心：AI越来越烧钱，ChatGPT的订阅费会不会年年涨？更让人头疼的，是用AI时越来越容易卡顿、掉链子。罪魁祸首，其实是芯片过热。

9/24/2025 1:07:28 PM

英伟达重金收购 AI 初创公司 Enfabrica CEO 及核心团队

近日，英伟达宣布了一项重大的收购交易，以超过9亿美元的现金和股票购买了 AI 硬件初创公司 Enfabrica 的首席执行官 Rochan Sankar 及其核心团队，同时获得了该公司的技术许可。这一交易的完成标志着英伟达在 AI 领域的进一步布局，特别是在提升其 GPU 连接能力方面。图源备注:图片由AI生成，图片授权服务商MidjourneyEnfabrica 成立于2019年，专注于开发能够将超过10万块 GPU 高效连接的技术，这一核心技术被认为可以帮助英伟达构建更为高效的一体化系统，使得大规模的计算集群能够像单台计算机一样运行。

9/19/2025 11:11:57 AM

AI在线

微软用「光」跑AI登上Nature！100倍能效颠覆GPU，华人首席研究员扛鼎

过去的几十年，各大公司都在芯片上暗暗较劲：芯片涨价、GPU短缺、AI算力焦虑...就在大家盯着芯片迭代升级时，微软在悄悄做另一件事：用光重新定义计算。他们花了四年，用手机摄像头、Micro LED和透镜，拼出了一台模拟光学计算机（AOC）。如今，这个实验已经登上Nature，带来了一个足以颠覆GPU的未来想象。

9/15/2025 9:15:00 AM

报道称：OpenAI 与博通合作开发自家 AI 芯片，明年开始量产

OpenAI 正在与美国芯片制造商博通合作，计划在明年推出自家的人工智能（AI）芯片。这一举动是 OpenAI 在行业内寻求独立于第三方半导体公司的重要一步。根据《金融时报》的报道，这款新型图形处理单元(GPU)将专门用于 OpenAI 的内部用途，而不会对外销售。

9/9/2025 11:15:23 AM

AI在线

一文带你开启 SmartNotebook 的 GPU 支持（PyTorch 实测）

在数据科学与深度学习的日常工作中，GPU 已经成为不可或缺的计算加速工具。无论是训练大规模 Transformer 模型，还是运行复杂的图像处理与科学计算任务，GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台，不仅支持在容器环境中快速部署，还可以通过简单的配置实现 GPU 加速，让用户在 DataNotebook 内即可运行深度学习任务。

8/29/2025 8:10:18 AM

新叔