AI在线 AI在线

英伟达

英伟达与港大携手推出新型视觉注意力机制,提升高分辨率生成速度超 84 倍!

近日,香港大学与英伟达共同研发了一种新的视觉注意力机制,名为广义空间传播网络(GSPN),该机制在高分辨率图像生成方面取得了显著的突破。 传统的自注意力机制虽然在自然语言处理和计算机视觉领域取得了不错的效果,但在处理高分辨率图像时却面临计算量巨大和空间结构损失的双重挑战。 传统的自注意力机制的计算复杂度为 O (N²),这使得处理长上下文时非常耗时,并且将二维图像转化为一维序列会导致空间关系的丢失。
6/10/2025 4:00:56 PM
AI在线

互联网女皇AI趋势报告:AI模型训练成本超高,但推理成本断崖式下降

根据互联网女皇发布的AI趋势报告的深度分析,人工智能(AI)模型的计算经济学正经历着一场关键的转变。 报告指出,训练最强大的大型语言模型(LLM)已成为人类历史上最昂贵、资本最密集的投入之一,目前每个模型的训练成本往往超过1亿美元。 Anthropic首席执行官Dario Amodei在2024年中指出,目前有模型正在训练,其成本接近10亿美元,并预测到2025年,训练成本高达100亿美元的模型可能会出现。
6/5/2025 3:01:01 PM
AI在线

英伟达推出 ProRL 方法:强化学习训练至 2000 步,打造全球最佳 1.5B 推理 AI 模型

英伟达推出 ProRL 强化学习方法,并开发出全球最佳的 1.5B 参数推理模型 Nemotron-Research-Reasoning-Qwen-1.5B。
6/5/2025 2:27:31 PM
故渊

AMD 收购软件优化创企 Brium,剑指英伟达 AI 硬件领域主导地位

这已是AMD两年内的第四笔AI相关收购,前几次分别为2023年8月的Mipsology、同年10月的Nod.AI,以及2024年7月的Silo AI。
6/5/2025 12:37:15 PM
清源

​英伟达董事马克・史蒂文斯一周内抛售超过百万股股票

英伟达公司(Nvidia Corp.)的董事马克・史蒂文斯(Mark Stevens)本周内出售了超过一百万股公司的股票,交易的总价值接近1.5亿美元。 这一举动发生在英伟达股票经历了一段时间的波动后,最近的股价有所回升。 根据美国证券交易委员会(SEC)周三公布的文件,史蒂文斯的股票销售分为两个交易,分别在周一和周二进行。
6/5/2025 11:00:55 AM
AI在线

英伟达发布Llama Nemotron Nano VL AI:登顶 OCRBench,高精度文档处理解决方案

英伟达(NVIDIA)于2025年6月3日正式发布 Llama Nemotron Nano VL,一款专为文档智能处理优化的紧凑型视觉-语言模型(VLM)。 该模型在 OCRBench v2基准测试中荣登榜首,展现了其在处理复杂文档、图表和视频帧方面的卓越能力。 凭借高效的推理性能和灵活的部署方式,Llama Nemotron Nano VL 为企业提供了从云端到边缘设备的高精度文档处理解决方案。
6/5/2025 10:01:06 AM
AI在线

英伟达发布 Llama Nemotron Nano VL AI:高效精准,攻克复杂文档解析难题

Llama Nemotron Nano VL 融合了 CRadioV2-H 视觉编码器和 Llama 3.1 8B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支持最长 16K 的上下文长度,覆盖图像和文本序列。
6/5/2025 8:01:43 AM
故渊

英伟达揭示RL Scaling魔力!训练步数翻倍=推理能力质变,小模型突破推理极限

强化学习(RL)到底是语言模型能力进化的「发动机」,还是只是更努力地背题、换个方式答题? 这个问题,学界争论已久:RL 真能让模型学会新的推理技能吗,还是只是提高了已有知识的调用效率? 过去的研究多数持悲观态度:认为 RL 带来的收益非常有限,有时甚至会让模型「同质化」加重,失去多样性。
6/4/2025 1:56:06 PM

英伟达CEO谈AI未来:四大趋势将助力市值迈向五万亿

在最近的财报电话会议上,英伟达(NVIDIA)首席执行官黄仁勋(Jensen Huang)分享了推动公司未来增长的四个关键人工智能(AI)趋势。 他表示,推理 AI、AI 普及、企业 AI 和工业 AI 将为英伟达带来巨大的市场机遇。 随着全球对 AI 技术需求的不断增加,这些趋势可能使英伟达的市值跃升至五万亿美元。
6/3/2025 6:00:54 PM
AI在线

英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架,推理速度提升惊人

在最近的科技进展中,英伟达与麻省理工学院(MIT)和香港大学联合推出了名为 Fast-dLLM 的新框架,显著提升了扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍。 这一创新的成果为语言模型的应用开辟了新天地。 扩散模型被视为自回归模型的有力竞争者,采用了双向注意力机制,使其在理论上能够实现多词元同步生成,从而加快解码速度。
6/3/2025 3:00:54 PM
AI在线

英伟达与MIT合作推出 Fast-dLLM 框架,AI 推理速度提升 27.6 倍

近日,科技巨头英伟达联合麻省理工学院(MIT)与香港大学,发布了名为 Fast-dLLM 的新框架。 这一创新的框架旨在显著提高扩散模型(Diffusion-based LLMs)的推理速度,最高可达27.6倍,为人工智能的应用提供了更为强大的技术支持。  扩散模型的挑战与机遇扩散模型被视为传统自回归模型(Autoregressive Models)的有力竞争者。
6/3/2025 2:00:54 PM
AI在线

英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。
6/3/2025 11:29:46 AM
故渊

英伟达 CEO 黄仁勋:中国的 Deepseek 和阿里通义千问是当前最佳开源模型

他表示,DeepSeek 和阿里巴巴的通义千问(Qwen)是“当前表现最优的开源 AI 模型之一”,已在美国、欧洲等多个市场获得广泛应用。
5/30/2025 9:07:30 PM
清源

100亿H20没卖出,英伟达狂赚1000多亿破纪录!

英伟达狂赚不止,再次交出了亮眼成绩单! 今早,英伟达2026财年第一季度财报公布,再次破纪录:营收达441亿美元,较上一季度增长12%,较去年同期增长69%数据中心收入达391亿美元,较上一季度增长10%,较去年同期增长73%数据中心占据收入的大头,其次为游戏。 受新出口许可要求影响,英伟达因H20库存积压及采购义务,在本季度计提了45亿美元费用。
5/30/2025 8:40:00 AM

英伟达 CEO 黄仁勋:未来每个制造业工厂都会有匹配的“AI 工厂”

英伟达CEO黄仁勋表示,未来每个制造业工厂都将配备AI工厂,推动AI技术在各行业的应用。目前AI技术仍处于早期阶段。#AI工厂##制造业未来#
5/29/2025 9:55:54 AM
浩渺

英伟达再破世界纪录,每秒1000 token!刚刚,全球最快Llama 4诞生

你以为,AI推理的速度已经够快了? 不,英伟达还能再次颠覆你的想象——就在刚刚,他们用Blackwell创下了AI推理的新纪录。 仅仅采用单节点(8颗Blackwell GPU)的DGX B200服务器,英伟达就实现了Llama 4 Maverick模型每秒单用户生成1000个token(TPS/user)的惊人成绩!
5/23/2025 1:50:39 PM

英伟达黄仁勋称摩尔定律“已走到尽头”,未来只有天空才能限制 AI 产业发展

他认为,我们已经看到了物理极限、芯片成本上涨、能源效率等问题,而且处理器的速度也没能跟着快速提升。因此,英伟达正通过三种方式,加速推进AI芯片和整个行业的发展。
5/21/2025 6:01:01 PM
清源

英伟达推出 Cosmos-Reason1 系列模型,让 AI 理解物理常识

英伟达针对物理推理任务,设计推出了 Cosmos-Reason1 系列模型,提升了 AI 在物理常识和具身推理方面的表现,为机器人、自动驾驶车辆等领域带来实际应用潜力。
5/21/2025 2:53:40 PM
故渊