AI在线 AI在线

英伟达

​CoreWeave 率先推出英伟达最新 AI 芯片,助力云计算行业创新

近日,英伟达与 CoreWeave 宣布,英伟达最新的人工智能图形处理器 Blackwell Ultra 芯片已在 CoreWeave 实现商业部署。 这一消息无疑为 AI 技术的云计算服务注入了新的活力。 戴尔也表示,CoreWeave 已经收到基于英伟达 GB300NVL72AI 系统的定制设备,这标志着 CoreWeave 成为首家安装基于 Blackwell Ultra 系统的云服务提供商。
7/5/2025 7:46:36 AM
AI在线

​OpenAI 暂停大规模使用谷歌 TPU 芯片,英伟达与 AMD 仍为核心供应商

OpenAI 最近宣布,尽管在初期阶段进行了测试,但不会大规模采用谷歌的 TPU 芯片。 TPU(张量处理单元)是谷歌专为机器学习任务设计的定制化 ASIC 芯片,旨在加速神经网络的训练与推理。 TPU 采用数据流驱动架构,能够实现高效的矩阵乘法流水线计算,从而减少内存访问延迟。
7/3/2025 9:00:46 AM
AI在线

OpenAI要抛弃英伟达?紧急辟谣:转向谷歌TPU是乌龙,根本无部署计划!满血版芯片谷歌自留,OpenAI被迫搞自研今年就流片!

编辑 | 伊风出品 | 51CTO技术栈(微信号:blog51cto)“OpenAI转向谷歌芯片”? 这事恐怕真被大家误会了。 几天前,路透社爆出猛料——知情人士称,OpenAI 已经开始租用谷歌的 AI 芯片 TPU,用来支撑 ChatGPT 和其他产品的运行。
7/1/2025 12:22:17 PM
伊风

显存优化!英伟达 DLSS 4 让游戏更流畅,Transformer 模型显存减少 20%

在游戏性能日益提升的今天,英伟达再次引领了显卡技术的潮流。 最新发布的 DLSS4SDK,不仅正式上线,还在显存(VRAM)的使用上进行了重大优化,让玩家们在享受高质量游戏画面的同时,显卡的负担也大大减轻。 根据相关报道,英伟达在最新的 DLSS310.3.0版本中,对 Transformer 模型的显存占用进行了20% 的优化。
6/30/2025 11:00:49 AM
AI在线

投行称英伟达市值将冲击6万亿美元 AI之外还有机器人万亿市场

在AI浪潮的持续驱动下,英伟达股价近年屡创新高且涨势未止。 投行Loop Capital最新研判显示,其市值最终或冲至6万亿美元。 当前英伟达市值约为3.6万亿美元,若达成这一目标,意味着仍有65%上涨空间。
6/30/2025 1:00:00 AM
小刀

不再单一依赖英伟达,消息称 OpenAI 首次采用谷歌 AI 芯片训练 ChatGPT

据路透社今日援引知情人士消息,OpenAI 开始租用谷歌的人工智能芯片,为 ChatGPT 和其他产品提供算力支持。
6/28/2025 9:23:45 AM
清源

8 秒转录 30 分钟播客:MacWhisper 应用接入英伟达 Parakeet 模型

科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。
6/28/2025 6:54:35 AM
故渊

√N并行+84倍计算加速!英伟达港大全新图像注意力:空间结构都保留

Transformer 及其核心的注意力机制在自然语言处理和计算机视觉等领域带来了革命性进展,展现出强大的深度上下文建模和数据间复杂依赖关系捕捉能力。 然而,其在处理视觉数据时面临两大核心挑战:二次计算复杂度使其难以高效处理高分辨率图像等长上下文数据;忽略空间结构,将多维图像视为无结构的一维标记序列,破坏了图像固有的空间连贯性,而这种信息对于依赖空间关系的视觉任务至关重要。 为克服效率瓶颈,近期研究如线性注意力和状态空间模型(如 Mamba) 致力于将复杂度降低至线性。
6/18/2025 1:59:11 PM

大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成

随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。 传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。 为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。
6/18/2025 10:01:58 AM
AI在线

逐个token太慢!大模型原生并行出token,CMU、英伟达新作Multiverse

众所周知,大语言模型的参数量越来越大,算力需求也越来越可怕,然而因为「祖宗之法」,推理只能一个一个 token 按顺序来。 对此,卡耐基梅隆大学(CMU)Infini-Al-Lab 的研究人员拿出了「多元宇宙」Multiverse,这是一个全新的生成式建模框架,支持原生的并行生成。 参与这项研究的机器学习大佬,CMU 助理教授陈天奇表示,这是一个有前途的大方向。
6/18/2025 8:51:28 AM

黄仁勋反驳Anthropic CEO:呼吁AI开放,反对夸大风险与成本

在法国巴黎VivaTech大会上,英伟达首席执行官黄仁勋对Anthropic首席执行官达里奥·阿莫迪此前关于人工智能(AI)的言论进行了公开反驳。 此前,Meta公司AI首席研究员Yann LeCun也已对阿莫迪进行了数周的批评。 黄仁勋明确不同意阿莫迪关于AI可能在五年内取代一半入门级办公室工作的说法。
6/16/2025 10:09:58 AM
AI在线

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

扩散方法打入语言模型领域! 最近,康奈尔博士生Subham Sahoo,在X介绍了扩散大语言模型的最新工作。 这项研究引发了AI研究领域的思考。
6/16/2025 9:13:00 AM

Mistral AI 在欧洲推出 Mistral Compute 云平台,进军基础设施市场

Mistral AI 宣布推出 Mistral Compute AI 云平台,正式进军 AI 基础设施市场,与微软 Azure、亚马逊 AWS 等竞争。平台基于英伟达 GPU 和 Mistral 自家训练工具包,提供从裸机到全托管 PaaS 的解决方案。目前服务覆盖欧洲,未来将扩展至中东、亚洲等地。#AI云平台# #MistralAI#
6/14/2025 3:34:10 PM
漾仔

挑战英伟达主导地位,AMD 联手多家 AI 初创公司改进芯片及软件设计

随着越来越多的AI企业寻求英伟达芯片的替代方案,AMD 开始扩大布局,计划打造竞争力更强的硬件,并收购了服务器制造商 ZT Systems。
6/14/2025 8:52:59 AM
清源

超越英伟达B200!AMD最强AI芯:1.6倍大内存、大模型推理快30%,奥特曼都来站台

AMD大招逆袭,最强AI芯片号称大模型推理比英伟达B200快30%! CEO苏姿丰与OpenAI奥特曼共同登台发布。 这次AMD发布了MI350X和MI355X两款GPU,采用3nm工艺,包含1850亿晶体管,配备HBM3E内存。
6/13/2025 11:24:39 AM

黄仁勋发布量子计算专用CUDA!预言量子计算机几年内应用,但现在还离不开GB200

“量子计算正在到达一个拐点。 ”在GTC巴黎的演讲中,英伟达CEO黄仁勋对量子计算给出了新的论断。 这次,老黄一改此前“实用量子计算机还要20年”的观点,预言量子计算机的实际应用在几年内就能实现。
6/13/2025 9:06:00 AM

黄仁勋亲述:当年如何把“价值数十亿美金”的首台AI超算,亲手送给了OpenAI

老黄在法国巴黎最新演讲讲了一个小故事:OpenAI如何获得全世界第一台AI超级计算机。 如今,当人们谈论这一波人工智能的浪潮时,英伟达(NVIDIA)和OpenAI是两个无法绕开的名字。 前者是AI算力的基石,后者则用ChatGPT等产品引爆了全球的AI革命。
6/13/2025 9:02:18 AM

消息称英伟达、三星联手投资 AI 机器人公司 Skild AI,估值达 45 亿美元

英伟达、三星等科技巨头投资AI机器人公司Skild AI,估值达45亿美元。软银领投1亿美元,特斯拉、苹果等也在布局机器人领域。英伟达推广“实体AI”概念,认为其将成为重要收入来源。#AI机器人##科技投资#
6/12/2025 12:48:50 PM
箫雨