AI在线 AI在线

英伟达

英伟达RTX 5090功耗高达600W,32G显存,核心比5080多一倍

RTX 50 系列的发布日期可能会在明年初。英伟达的 RTX 50 系列会整出什么新活?随着芯片发布日期的临近,人们的猜测也越来越密集起来。最近,海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息,让我们对新 GPU 有了一些初步的概念。如果消息正确,那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率(TGP)的怪物。这些规格中的许多与之前的曝光内容一致,不过也有一些新的消息。根据最新消息,
9/27/2024 12:52:00 PM
机器之心

英伟达 Jim Fan:复刻NLP的成功路,用通用模型开启具身智能的GPT-3时刻

还记得那只“骑”瑜伽球的机械狗吗? 过马路,走草地都稳稳当当,就算瑜伽球被放气也能如履平地。 怪不得之前有网友惊叹:机器人马上就要统治世界了吧?
9/23/2024 11:49:00 AM
刘洁

英伟达市值一周蒸发4060亿美元,AI时代「卖铲人」怎么就不香了?

「卖铲人」英伟达股价又又又跌了。江湖上流传着一张梗图,说美国经济有两大支柱:一个是创下巡演纪录的泰勒・斯威夫特,一个是人工智能时代的「卖铲人」英伟达。英伟达也确实不负众望,8 月底出炉的 2024 年第二季度财报,成绩相当亮眼。财报显示,英伟达在该季度收入 300.4 亿美元,高于去年同期的 135.1 亿美元,超出了普遍预期的 207.5 亿美元。净利润达到了 166 亿美元,比去年同期增长了 152%。然而,逆天的业绩并未带来股价的狂飙,而是再三暴跌。英伟达股价跌跌跌8 月 29 日,英伟达交出「炸裂」财报后,
9/8/2024 1:28:00 PM
机器之心

AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的

都很贵。AMD vs 英伟达绝对算是一个长盛不衰的话题 —— 从玩游戏用哪家强到如今训练 AI 哪个更高效?原因也很简单:它们的 GPU 产品存在直接竞争关系。当然,答案通常都偏向于英伟达,尤其是在 AI 算力方面,正如前些天李沐在上海交大演讲时谈到的那样:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案,比如在同一个演讲中,李沐还提到了这两家 GPU 的内存情况,对此他表示:「在这一块,虽然英伟
9/4/2024 8:54:00 PM
机器之心

英伟达全新视觉语音模型 NVEagle,可看图聊天;六个月亏了 5 个亿,寒武纪上半年营收仅 6476 万丨AI情报局

今日融资快报无问芯穹完成近5亿元A轮融资无问芯穹致力于提供AGI算力解决方案,以无穹大模型能效优化工具包为基础,旨在解决大模型算法向大算力芯片的高效统一部署问题。 本轮融资联合领投方为社保基金中关村自主创新专项基金(君联资本担任管理人)、启明创投和洪泰基金,跟投方包括联想创投、小米、软通高科等战略投资方,国开科创、上海人工智能产业投资基金(临港科创投担任管理人)、徐汇科创投等国资基金,以及顺为资本、达晨财智、德同资本、尚势资本、森若玉坤、申万宏源、正景资本等财务机构。 过往投资方包括红杉中国、百度、智谱、同歌创投等。
9/3/2024 2:02:00 PM
我在思考中

英伟达首个AI NPC入驻游戏,国产大作,4B模型只需2G显存

玩家都在问:游戏什么时候上线?大模型驱动的游戏 NPC 终于落地了。今天凌晨,英伟达放出一段游戏 demo。现在打游戏,你可以用语音对话的方式和 NPC 交流,了解关卡目标、优化装备配置,随后调整武器配色开始战斗。备受期待的 AI NPC 引擎在多人机甲战斗游戏《解限机》Mecha BREAK 中首次亮相了。全球首次,是国产游戏。作为一款重 PVP 游戏,解限机目标成为全球级电竞产品。它在 8 月份刚刚结束先行测试,不少人表示「封测结束得太早」。目前该游戏在 Steam 平台上愿望单收藏量已超过百万,国内外也出现了
8/21/2024 2:48:00 PM
机器之心

英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强

小模型崛起了。上个月,Meta 发布了 Llama 3.1 系列模型,其中包括 Meta 迄今为止最大的 405B 模型,以及两个较小的模型,参数量分别为 700 亿和 80 亿。Llama 3.1 被认为是引领了开源新时代。然而,新一代的模型虽然性能强大,但部署时仍需要大量计算资源。因此,业界出现了另一种趋势,即开发小型语言模型 (SLM),这种模型在许多语言任务中表现足够出色,部署起来也非常便宜。最近,英伟达研究表明,结构化权重剪枝与知识蒸馏相结合,可以从初始较大的模型中逐步获得较小的语言模型。       
8/16/2024 2:31:00 PM
机器之心

谷歌超 25 亿美金收购 Character AI;曝英伟达 AI 芯片遇重大设计缺陷,数百亿美元订单将受影响丨AI情报局

今日融资快报谷歌超 25 亿美金收购 Character AI 并收编团队Character.AI 在官方博客 C.AI 上宣布了与 Google 的并购协议。 谷歌已同意支付模型授权费,并聘请其核心创始人 Noam Shazeer 和 Daniel De Freitas ,以及Character 从事模型训练和语音人工智能工作的员工(约130名员工中的30名),参与Gemini AI项目。 谷歌以25亿美元的估值向Character.AI 的投资者支付等数额的股权价值,未跟随进入谷歌的员工手里的期权将会以每股 88 美元的价格回购,这大约是Character.AI2023 年 A 轮融资股票价值的 2.5 倍。
8/5/2024 9:50:00 AM
我在思考中

在SIGGRAPH 2024上,英伟达开始引领下一波浪潮:物理AI

「第一波是加速计算,它降低了能耗,下一代 AI 是企业级客户服务。我们希望让每个组织都有机会创建自己的 AI。」
7/30/2024 6:05:00 PM
李泽南

英伟达对话模型ChatQA进化到2.0版本,上下文长度提到128K

开放 LLM 社区正是百花齐放、竞相争鸣的时代,你能看到 Llama-3-70B-Instruct、QWen2-72B-Instruct、Nemotron-4-340B-Instruct、Mixtral-8x22BInstruct-v0.1 等许多表现优良的模型。但是,相比于以 GPT-4-Turbo 为代表的专有大模型,开放模型在很多领域依然还有明显差距。在通用模型之外,也有一些专精关键领域的开放模型已被开发出来,比如用于编程和数学的 DeepSeek-Coder-V2、用于视觉 - 语言任务的 InternVL
7/25/2024 3:25:00 PM
机器之心

科大讯飞将在港投资 4 亿港元,专注大语言模型等开发;英伟达 Mistral AI 联手发布 12B 参数小模型丨AI情报局

今日融资快报科大讯飞将在香港投资 4 亿港元,并设立国际总部科大讯飞公布了一项为期 5 年的 4 亿港元、投资计划,并在香港设立了国际总部。 公司表示,这项投资计划将支持其组建一支 150 人的研发团队,专注于大语言模型的开发,以及智能语音、教育和医疗等领域的 AI 应用。 科大讯飞副总裁段大为表示:“我们的初期预算是 4 亿港元。
7/22/2024 9:57:00 AM
我在思考中

漆远获新融资,阿里云参投;芯原创始人直言百模大战就是“群模乱舞”,是在浪费电;英伟达今年在华将交付超100万颗芯片丨AI情报局

融资快报无限光年完成新一轮融资:无限光年的核心产品是可信大模型,这是漆远认为通往人工智能通用智能的道路。 可信大模型结合了大语言模型与符号推理,旨在解决大模型的幻觉问题和遗忘性灾难,提高模型的可信度和可解释性。 无限光年已完成多轮融资,并与金融和医疗行业的头部企业合作,打造了针对特定行业的精专大模型。
7/8/2024 11:01:00 AM
我在思考中

英伟达成全球市值最高公司,黄仁勋加州理工演讲:年轻人抓住机会,要跑不要走

新一轮 AI 革命的最大受益者。6 月 18 日,全球科技领域迎来了一个重要时刻。英伟达超越微软,成为了全球市值最高的公司。这家芯片制造商在最近一个交易日的股价上涨 3.5% 达到 135.58 美元,市值升至 3.334 万亿美元。其实就在几天前,英伟达还刚刚超越了苹果,占据了全球市值第二的位置。过去一年里,英伟达市值持续飙升,已成为华尔街对新兴生成式人工智能技术乐观情绪的象征。不过在另一方面,虽然英伟达的涨势推动标准普尔 500 和纳斯达克指数创下历史新高,但也有投资者逐渐担心,如果出现技术发展放缓的迹象,市场
6/19/2024 3:30:00 PM
机器之心

英伟达开源最强通用模型Nemotron-4 340B

性能超越 Llama-3,主要用于合成数据。英伟达的通用大模型 Nemotron,开源了最新的 3400 亿参数版本。本周五,英伟达宣布推出 Nemotron-4 340B。它包含一系列开放模型,开发人员可以使用这些模型生成合成数据,用于训练大语言模型(LLM),可用于医疗健康、金融、制造、零售等所有行业的商业应用。高质量的训练数据在自定义 LLM 的响应性能、准确性和质量中起着至关重要的作用 —— 但强大的数据集经常是昂贵且难以访问的。通过独特的开放模型许可,Nemotron-4 340B 为开发人员提供了一种免
6/16/2024 6:26:00 PM
机器之心

英伟达 Jim Fan:具身智能的难点不是硬件,而是「Foundation Agent」

作者丨赖文昕 马蕊蕾编辑丨陈彩娴大模型浪潮一起,被视为是大模型最佳载体的机器人,热度也随之飙升,「具身智能」这个在1950年由艾伦·图灵提出的概念,时隔75年再次成为了 AI 界的宠儿。 2024年才过去不到半年,AI 圈就迎来了 Sora、Claude 3、Devin、GPT-4o 等数颗重磅炸弹,文生视频、AI Agent(智能体)、多模态等多个方向都有了显著的进展。 但显然,与屡爆惊喜的模型、应用不同,更「硬」的「具身智能」在产业界掀起商业化与资本狂潮的同时,也面临着需要冷静的现实:大模型并未在行业中得到广泛应用。
6/4/2024 2:38:00 PM
赖文昕

全球最强GPU芯片已量产、下一代Rubin曝光,老黄继续打破摩尔定律

黄仁勋:我家的 GPU 芯片一年一更新,其他家怎么追?昨晚,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。                               经典皮肤(皮衣)老黄亮相。在会上,黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。量产版 Blackwell 亮相下一代 AI 平台 Rubin 两年后到来今年 3 月,英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 B
6/3/2024 4:02:00 PM
机器之心

英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元

英伟达:尽管建,用的还是我的芯片,最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。早在 2022 年,Meta 即宣布与英伟达共同打造大型 AI 研究超级计算机「AI Research SuperCluster」(RSC),它由 760 个英伟达 DGX A100 系统组成,共有 6080 块 GPU,性能非常强大。如今,马斯克旗下人工智能初创公司 xAI 传出了打造超级计算机的消息。据外媒 The
5/27/2024 3:25:00 PM
机器之心

GTC大会开完一个月,英伟达的Omniverse Cloud API正在快速落地

今年的 GTC 大会上,英伟达宣布利用生成式 AI 等技术构建了业内领先的元宇宙、工业数字孪生、机器人训练软件体系。新技术基于英伟达实时模拟和协作平台 Omniverse。随着 Omniverse Cloud API 的推出,模拟现实环境的工具已经扩大了覆盖范围,现在已经被很多公司用于创建工业数字孪生应用程序和工作流程。在 3 月,共有五个新的 Omniverse Cloud 应用程序编程接口被引入,使开发人员能够轻松地将核心 Omniverse 技术直接集成到数字孪生的现有设计和自动化软件应用程序中,或者用于测试
4/29/2024 4:53:00 PM
李泽南