GPU
阿里云GPU用量削减82%的技术突破:Aegaeon计算池化方案深度解析
1192个GPU削减到213个,82%的用量削减——当我看到阿里云Aegaeon系统在三个月测试中的这个数据时,第一反应是这怎么可能? 要知道,这可是在服务数十个720亿参数大模型的情况下实现的。 按照现在H20 GPU的价格,这意味着硬件成本直接砍掉了80%以上。
10/23/2025 9:19:43 AM
阿丸笔记
DeepSeek新模型被硅谷夸疯了!用二维视觉压缩一维文字,单GPU能跑,“谷歌核心机密被开源”
DeepSeek最新开源的模型,已经被硅谷夸疯了! 因为实在太DeepSeek了。 3B规模、指数级效能变革、大道至简,甚至被认为把谷歌Gemini严防死守的商业机密开源了。
10/21/2025 8:03:21 AM
Meta用40万个GPU小时做了一个实验,只为弄清强化学习Scaling Law
在 LLM 领域,扩大强化学习算力规模正在成为一个关键的研究范式。 但要想弄清楚 RL 的 Scaling Law 具体是什么样子,还有几个关键问题悬而未决:如何 scale? scale 什么是有价值的?
10/20/2025 9:05:00 AM
实锤了:GPU越多,论文接收率越高、引用越多
在过去三年里,AI 领域取得了显著进步,这一飞跃主要得益于基础模型的发展。 这些模型在大规模多模态数据上进行训练,并在公开发布后取得了巨大成功。 然而,基础模型的研究需要大量的数据、算力和人力资源。
10/17/2025 4:40:00 PM
机器之心
前董事长罕见曝OpenAI的“痛苦与困境”:我们正走向计算稀缺世界!内部GPU分配如玩俄罗斯方块,Sora2实为被削弱的原始模型
编辑 | 听雨“我们正走向一个计算极度稀缺的世界,而能源将是下一个巨大的瓶颈。 ”“未来,所有的授权都会变成‘角色扮演’授权。 ”“我们希望能建立可以自主思考一年、甚至十年的AI。
10/14/2025 2:43:11 PM
听雨
刚刚,全球首个GB300巨兽救场!一年烧光70亿,OpenAI内斗GPU惨烈
过去一年,OpenAI在算力上斥资70亿美元。 其中,大模型研发占了最大头——50亿美元,而推理计算仅用了20亿美元。 图片可见,LLM训练正吞噬无尽的算力,这也是OpenAI最近一直在大举扩展超算建设与合作的重要原因。
10/11/2025 10:34:49 AM
新智元
如何在 LLM 推理中战胜不确定性
最近thinkingmachines的一篇博文在内外网引起了无数的关注和转载,这篇文章的核心内容先是解释了一下为什么LLM推理会有不确定性,随后文章还给出了具体的解决方案。 在详细介绍文章的内容之前,我们先来说一下thinkingmachines这家公司。 它是由前OpenAI首席技术官Mira Murati与多位前OpenAI高管联合创立。
9/28/2025 1:25:00 AM
技不辱你
一年4次迭代,狂堆GPU成真!微软AI冷液灌芯,散热暴涨3倍
大家一直在担心:AI越来越烧钱,ChatGPT的订阅费会不会年年涨? 更让人头疼的,是用AI时越来越容易卡顿、掉链子。 罪魁祸首,其实是芯片过热。
9/24/2025 1:07:28 PM
英伟达重金收购 AI 初创公司 Enfabrica CEO 及核心团队
近日,英伟达宣布了一项重大的收购交易,以超过9亿美元的现金和股票购买了 AI 硬件初创公司 Enfabrica 的首席执行官 Rochan Sankar 及其核心团队,同时获得了该公司的技术许可。 这一交易的完成标志着英伟达在 AI 领域的进一步布局,特别是在提升其 GPU 连接能力方面。 图源备注:图片由AI生成,图片授权服务商MidjourneyEnfabrica 成立于2019年,专注于开发能够将超过10万块 GPU 高效连接的技术,这一核心技术被认为可以帮助英伟达构建更为高效的一体化系统,使得大规模的计算集群能够像单台计算机一样运行。
9/19/2025 11:11:57 AM
AI在线
微软用「光」跑AI登上Nature!100倍能效颠覆GPU,华人首席研究员扛鼎
过去的几十年,各大公司都在芯片上暗暗较劲:芯片涨价、GPU短缺、AI算力焦虑...就在大家盯着芯片迭代升级时,微软在悄悄做另一件事:用光重新定义计算。 他们花了四年,用手机摄像头、Micro LED和透镜,拼出了一台模拟光学计算机(AOC)。 如今,这个实验已经登上Nature,带来了一个足以颠覆GPU的未来想象。
9/15/2025 9:15:00 AM
报道称:OpenAI 与博通合作开发自家 AI 芯片,明年开始量产
OpenAI 正在与美国芯片制造商博通合作,计划在明年推出自家的人工智能(AI)芯片。 这一举动是 OpenAI 在行业内寻求独立于第三方半导体公司的重要一步。 根据《金融时报》的报道,这款新型图形处理单元(GPU)将专门用于 OpenAI 的内部用途,而不会对外销售。
9/9/2025 11:15:23 AM
AI在线
一文带你开启 SmartNotebook 的 GPU 支持(PyTorch 实测)
在数据科学与深度学习的日常工作中,GPU 已经成为不可或缺的计算加速工具。 无论是训练大规模 Transformer 模型,还是运行复杂的图像处理与科学计算任务,GPU 都能显著提升性能。 SmartNotebook 作为一款类似 Hex.tech 的现代化 DataNotebook 平台,不仅支持在容器环境中快速部署,还可以通过简单的配置实现 GPU 加速,让用户在 DataNotebook 内即可运行深度学习任务。
8/29/2025 8:10:18 AM
新叔
马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖
马斯克昨天在X上发了一条消息:"xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100,这什么概念? 我算了一下,这相当于35个核电站的发电量才能供得起。
7/25/2025 9:25:05 AM
阿丸笔记
惊到了!大神炮轰CUDA:CUDA存致命缺陷,它不是未来!这种新语言将打破英伟达的GPU垄断地位,护城河终会消失!
编辑 | 云昭CUDA一直被视为英伟达GPU的最强壁垒,让许多业界的玩家望洋兴叹。 但,今天这篇文章会给各位习惯C 、CUDA开发的大佬提个醒:有一种新的编程语言,正在AI圈兴起,撬动英伟达的围墙花园。 而CUDA也不再是护城河。
7/21/2025 12:53:30 PM
云昭
老黄再收95后华人才俊!4亿美元收购AI初创公司
鹭羽 白交 发自 凹非寺. 量子位 | 公众号 QbitAI又一家95后华人AI初创,被老黄收购! 仅四亿美金的收购金额,就把员工全部打包带回英伟达。
7/6/2025 2:10:12 PM
鹭羽
刚刚,Ilya官宣出任SSI CEO!送走「叛徒」联创,豪言不缺GPU
小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的CEO。
7/4/2025 8:33:30 AM
新智元
韩国计划未来5年在人工智能领域投入16万亿韩元
据媒体报道,韩联社援引韩国科技部向总统国政规划委员会报告的计划称,韩国政府将在未来 5 年内在人工智能领域投入16. 1 万亿韩元。 保障 5 万颗GPU安全供应,打造AI数据中心。
6/18/2025 3:02:15 PM
AI在线
资讯热榜
早鸟票倒计时3天|第四届全国大模型智能生成大会(LMG 2025)
美国女子使用ChatGPT生成号码购彩中奖10万美元:概率事件而非AI预测能力
AI音乐创作成程序员新副业:单曲播放破200万,版权收入数万元
OpenAI 紧急暂停 Sora生成马丁・路德・金形象,AI 视频生成引发热议!
推理提速4倍!莫纳什、浙大提出动态拼接,大小模型智能协作
AICoding减慢了软件交付!旧金山创始人警告:AI改变了节奏,压力更大!团队七成时间耗在外环;AI泡沫非坏事;解决问题是关键
AI 模型“炒股”比拼!DeepSeek 收益超14%,Gemini2.5Pro 惨亏四成
全新开源的DeepSeek-OCR,可能是最近最惊喜的模型!
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
芯片
Stable Diffusion
腾讯
AI for Science
苹果
Agent
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
人形机器人
研究
AI视频
生成
大语言模型
百度
Sora
工具
GPU
RAG
具身智能
华为
计算
字节跳动
AI设计
搜索
大型语言模型
AGI
视频生成
场景
深度学习
架构
DeepMind
视觉
预测
Transformer
伟达
编程
生成式AI
AI模型
特斯拉
Copilot