GPU
马斯克23万GPU训练Grok-这规模让OpenAI都要颤抖
马斯克昨天在X上发了一条消息:"xAI的目标是在5年内部署相当于5000万个H100的AI算力。 "5000万个H100,这什么概念? 我算了一下,这相当于35个核电站的发电量才能供得起。
7/25/2025 9:25:05 AM
阿丸笔记
惊到了!大神炮轰CUDA:CUDA存致命缺陷,它不是未来!这种新语言将打破英伟达的GPU垄断地位,护城河终会消失!
编辑 | 云昭CUDA一直被视为英伟达GPU的最强壁垒,让许多业界的玩家望洋兴叹。 但,今天这篇文章会给各位习惯C 、CUDA开发的大佬提个醒:有一种新的编程语言,正在AI圈兴起,撬动英伟达的围墙花园。 而CUDA也不再是护城河。
7/21/2025 12:53:30 PM
云昭
老黄再收95后华人才俊!4亿美元收购AI初创公司
鹭羽 白交 发自 凹非寺. 量子位 | 公众号 QbitAI又一家95后华人AI初创,被老黄收购! 仅四亿美金的收购金额,就把员工全部打包带回英伟达。
7/6/2025 2:10:12 PM
鹭羽
刚刚,Ilya官宣出任SSI CEO!送走「叛徒」联创,豪言不缺GPU
小扎到处挖人的举动,不仅是惹恼了奥特曼,连Ilya都忍无可忍,被炸出来了! 就在刚刚,消失许久的Ilya忽然现身X。 他发文表示,自己已亲自挂帅「安全超级智能」(SSI)的CEO。
7/4/2025 8:33:30 AM
新智元
韩国计划未来5年在人工智能领域投入16万亿韩元
据媒体报道,韩联社援引韩国科技部向总统国政规划委员会报告的计划称,韩国政府将在未来 5 年内在人工智能领域投入16. 1 万亿韩元。 保障 5 万颗GPU安全供应,打造AI数据中心。
6/18/2025 3:02:15 PM
AI在线
免费GPU算力部署DeepSeek-R1 32B
前言DeepSeek-R1发布最新版本DeepSeek-R1-0528,显著提升了模型的思维深度与推理能力,在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 另外,API接口还增加了Function Calling和JsonOutput 的支持。 DeepSeek-R1团队已经证明,大模型的推理模式可以蒸馏到小模型中,与通过强化学习在小模型上发现的推理模式相比,性能更优。
6/12/2025 9:48:27 AM
Meta「轻量级」KernelLLM颠覆GPU内核生成,8B参数碾压GPT-4o
在AI领域,参数规模曾被视为「性能天花板」。 Meta最新发布的KernelLLM,却用8B参数的「小身板」,在GPU内核生成任务中把200B的GPT-4o按在地上摩擦。 这是一个基于Llama 3.1 Instruct进行微调的8B参数模型,旨在将PyTorch模块自动转换为高效的Triton GPU内核。
5/27/2025 3:19:52 PM
新智元
秘塔AI搜索推出全新“极速”模型:最高400 tokens/秒响应速度
近日,秘塔AI搜索正式推出全新“极速”模型,为用户带来更高效、精准的搜索体验。 秘塔AI搜索团队通过在GPU上进行kernel fusion技术,以及在CPU上实施动态编译优化策略,成功在单张H800GPU上实现了最高400tokens/秒的响应速度,大部分问题能在2秒内给出答案。 为了让用户更真切地感受新模型的速度,秘塔AI搜索还特别搭建了一个测速站点(kuai.metaso.cn),用户可随时输入问题,亲自体验新模型带来的快速响应。
5/27/2025 10:01:20 AM
AI在线
NVIDIA全新GeForce GPU震撼亮相!黄仁勋:AI与模拟交织,极致美感颠覆游戏与创作!
NVIDIA在台北COMPUTEX2025大会上正式发布全新GeForce GPU系列,引发全球科技圈热议。 NVIDIA首席执行官黄仁勋在主题演讲中表示:“你在这里看到的都不是艺术,只是恰好很美而已”,强调新GPU通过人工智能与实时模拟的融合,为游戏玩家、内容创作者和AI开发者带来前所未有的视觉与性能体验。 AIbase综合最新动态,深入解析这一突破性发布的技术亮点及其对AI与游戏生态的深远影响。
5/19/2025 6:00:55 PM
AI在线
5090将被秘密定位?美或强制植入「地理追踪」,锁定英伟达高端GPU
最近,美参议员Tom Cotton提出了一项新法案——要为英伟达、AMD等高端GPU装上「地理追踪」功能,防止落入竞争国家手中。 此举,不仅针对的是AI芯片,还涵盖了高性能游戏显卡等硬件。 若是法案通过,这些措施将在6个月后生效。
5/15/2025 2:38:24 PM
Fastino 融资 1750 万美元,利用廉价游戏 GPU 训练 AI 模型
在当今科技行业,AI(人工智能)正迅速崛起,许多巨头公司都在大谈特谈拥有万亿参数的 AI 模型,这些模型通常需要耗费巨资搭建庞大的 GPU 集群。 然而,Fastino 却走了一条不同的道路,利用成本低廉的游戏 GPU 进行 AI 模型训练,并成功获得了由 Khosla Ventures 领投的1750万美元融资。 这一创新的方式使得 Fastino 能够在资源有限的情况下,实现高效的 AI 模型开发。
5/8/2025 12:01:07 PM
AI在线
AI学会“无师自通”?AZR让模型左右互搏,越打越聪明!
一项名为Absolute Zero Reasoner(AZR)的创新项目近日引发广泛关注。 该项目通过一种全新的“绝对零点”训练范式,让大型语言模型(LLM)能够自主提出问题、编写代码、运行验证,并通过自我博弈(self-play)循环提升编程与数学能力。 基于Qwen2.5-7B模型的测试数据显示,AZR在编程能力上提升了5分,数学能力提升了15.2分(满分100分),展现了其在AI自进化领域的巨大潜力。
5/8/2025 10:00:55 AM
AI在线
北京:对采购自主可控 GPU 芯片开展智能算力服务的民营企业按照投资额一定比例给予支持
《北京市促进民营经济健康发展、高质量发展2025年工作要点》近日发布。其中提出,北京将支持民营企业建设智算中心,对采购自主可控GPU芯片开展智能算力服务的企业,按照投资额的一定比例给予支持,还将重点支持民营企业参与绿色创新平台建设。
4/29/2025 4:16:41 PM
远洋
流体力学专用版DeepSeek,单GPU可跑,成本节约高达100倍
又一专业领域成功引入AI工程师! 而且还是基于DeepSeek、Qwen等国产大模型打造,国内研究人员都能用的那种。 不卖关子了,这就是由英国埃克塞特大学初旭副教授团队与北航王文康副教授团队联合打造的OpenFOAMGPT,将AI工程师成功引入计算流体力学(CFD)领域。
4/11/2025 9:22:00 AM
OpenFOAMGPT团队
刚刚,特朗普扼杀全美GPU供应链?科技大厂核心AI算力告急,硅谷陷巨大恐慌
关税大棒一出,连全美的GPU供应链也危在旦夕了? 昨夜,美股经历了5年未遇的史诗级暴跌,更可怕的是,AI界已经被特朗普的关税政策,搞得乱成一锅粥了! 今天,纳斯达克综合指数直接跌超了近6%,与近一年来的新低仅一步之遥。
4/7/2025 8:38:00 AM
新智元
英伟达GPU命名背后:是情怀,也是致敬伟人的智慧! 新智元 新智元 2025年04月05日 12:17
在上周结束的GTC大会上,老黄用两个多小时向我们介绍了英伟达过去一年的进展。 其中,最让人们关注就是「每年一更」的用于未来AI工厂的GPU芯片架构路线图。 2024年,Blackwell GPU发布;2025年上半年,Blackwell GPU已经全面发货;2025年下半年,推出Blackwell Ultra;2026年下半年,将重磅发布Vera Rubin;2027年下半年,推出Rubin Ultra;再往后,就是2028年上市的Feynman。
4/7/2025 8:07:00 AM
新智元
25万GPU,估值350亿美元冲刺IPO!财务定时炸弹,GenAI不祥之兆
美国云服务公司CoreWeave,已提交上市文件,即将IPO。 这是美国近期首个有意义的科技IPO,也是首个直接与AI热潮相关的IPO。 CoreWeave虽然有25万GPU,却频频受到质疑。
3/21/2025 12:56:44 PM
新智元
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
训练
算法
AI新词
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
苹果
Claude
生成式
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用