AI在线 AI在线

算力

华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断

大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。 其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。 但是,在华为,昇腾万卡算力集群,已经可以做到近乎“永不罢工”了:训练可用度达98%:这就好比你开着一辆车,全年365天里,有358天无论刮风下雨都能一脚油门就出发,从不掉链子,有问题可以随时检修,几乎不会耽误你的任何行程。
6/10/2025 4:36:29 PM

RL后训练步入超节点时代!华为黑科技榨干算力,一张卡干俩活

在大模型竞赛白热化的当下,「强化学习后训练」已成为突破LLM性能天花板的核心路径。 爆火出圈的OpenAI o1、DeepSeek-R1等模型,背后都是依靠RL后训练点石成金。 相较于预训练阶段的「广撒网」式知识获取,RL 后训练通过驱动模型与外部环境进行动态交互,直接塑造了LLM在复杂任务中的推理效能。
6/6/2025 8:55:00 AM

奥特曼:假如给我一千倍算力,我会这样做

完美的人工智能是“一个拥有超人推理能力、1万亿个上下文标记并可以使用你能想到的所有工具的微型模型”。 这是奥特曼在最新的访谈中对下一代模型的展望。 他表示,理想中的AGI不需要包含知识——只需要思考、搜索、模拟和解决任何问题的能力。
6/5/2025 9:09:00 AM

CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割

本文共同第一作者为纽约大学研究生 Hongyi Zeng 和Wenxuan Liu。 合作作者为 Tianhua Xia、Jinhui Chen、Ziyun Li。 通讯作者为纽约大学电子工程系和计算机系教授 Sai Qian Zhang,研究方向为高效人工智能,硬件加速和增强现实。
6/3/2025 9:12:00 AM

o3崛起,但推理模型离「撞墙」只剩一年?

最多一年,推理模型就会撞上训练算力的「天花板」。 OpenAI的o3这样的推理模型,诞生还不到一年,能力已经突飞猛进。 OpenAI的研究人员非常乐观地认为,这种趋势会持续下去。
6/3/2025 8:26:00 AM

星门计划震撼全球!美阿联酋联手打造5吉瓦AI超级枢纽,算力革命来了!

人工智能基础设施建设迎来历史性突破!星门计划(Project Stargate)作为一项由OpenAI、Oracle、SoftBank及阿布扎比MGX基金共同推动的5000亿美元AI数据中心项目,正迅速扩展其版图。 从美国德克萨斯州阿比林的1.2吉瓦AI园区到阿联酋阿布扎比的5吉瓦超级数据中心,星门计划正以惊人速度重塑全球AI计算格局。 AIbase综合最新信息,为您深入解析这一全球瞩目的科技壮举。
5/26/2025 3:00:50 PM
AI在线

散户组团挑战算力霸权,40B 模型 + 20 万亿 token 刷新世界纪录

全球网友用闲置显卡组团训练大模型。40B 大模型、20 万亿 token,创下了互联网上最大规模的预训练新纪录!去中心化 AI 的反攻,正式开始。OpenAI 等巨头的算力霸权,这次真要凉了?
5/26/2025 9:56:55 AM
汪淼

帮大模型提速80%,华为拿出昇腾推理杀手锏FlashComm,三招搞定通算瓶颈

在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。 近日,华为数学家出手,祭出 FlashComm,三箭齐发,解决大模型推理通算难题:FlashComm1: 大模型推理中的 AllReduce 通信优化技术。 将 AllReduce 基于通信原理进行拆解,并结合后续计算模块进行协同优化,推理性能提升 26%。
5/22/2025 1:40:21 PM

OpenAI 得州数据中心扩建计划获 116 亿美元投资

有媒体报道称,初创公司 Crusoe 为 OpenAI 在得克萨斯州建设的数据中心成功获得116亿美元的融资。 这一资金将用于将目前的两栋建筑扩展至八栋,以满足日益增长的计算需求。 图源备注:图片由AI生成,图片授权服务商Midjourney据悉,这座数据中心预计将成为 OpenAI 的最大算力基地,每栋建筑将配备多达五万块英伟达 Blackwell 芯片。
5/22/2025 9:00:55 AM
AI在线

推理大模型1年内就会撞墙,性能无法再扩展几个数量级 | FrontierMath团队最新研究

一年之内,大模型推理训练可能就会撞墙。 以上结论来自Epoch AI。 这是一个专注于人工智能研究和基准测试的非营利组织,之前名动一时的FrontierMath基准测试(评估AI模型数学推理能力)就出自它家。
5/14/2025 9:07:00 AM

一个「always」站在大模型技术C位的传奇男子

怎么老是你? ? ?
5/12/2025 8:40:00 AM

LeCun被痛批:你把Meta搞砸了!烧掉千亿算力,自曝折腾20年彻底失败

凭借着GPT/o系列、Gemini 2.5、Claude的强大能力,OpenAI、谷歌、Anthropic纷纷在AI大战中各领风骚。 唯独Meta,没有走在前沿。 Llama 4自发布以来种种拉跨的表现,让Meta在某种程度上沦为了业内的「笑柄」。
4/21/2025 8:40:00 AM
新智元

克拉玛依(上海)智能算力产业推介会成功举办

本报上海讯(克拉玛依融媒特派记者 关祥荣 通讯员 彭囿源)在上海市对口支援克拉玛依市十周年之际,4月14日,以“沪克共赢 智算未来”为主题的克拉玛依(上海)智能算力产业推介会在上海市成功举办。 新疆维吾尔自治区政协副主席、克拉玛依市委书记石岗,新疆维吾尔自治区数字化发展局党组书记、副局长李长修,上海市人民政府合作交流办公室副主任熊英分别致辞,中国科学院院士何积丰作主旨演讲。 石岗在致辞中代表克拉玛依市委、市人民政府和全市人民,向出席推介会的嘉宾表示热烈欢迎,向大家长期以来对克拉玛依的关心和支持表示衷心感谢。
4/16/2025 5:55:00 PM
新闻助手

专访GMI Cloud创始人Alex Yeh:算力即未来,不做AI时代的旁观者

嘉宾 | Alex作者 | 云昭Alex Yeh回忆过去两年半的创业历程,用“一头深海中求生的鲨鱼”来形容GMI Cloud这家新创公司。 海水中礁石隐藏在未知的角落,绕开礁石继续前行则成为了这条鲨鱼的常态。 Alex Yeh是AI Native Cloud 提供商 GMI Cloud 的创始人兼CEO。
4/15/2025 6:45:34 AM
云昭

4090玩转大场景几何重建,RGB渲染和几何精度达SOTA|上海AI Lab&西工大新研究

仅用4090就能实现大规模城市场景重建! 高效几何重建新架构CityGS-X来了,通过一种新型并行化混合分层三维表征架构(PH²-3D)的可扩展系统,突破了传统三维重建在算力消耗和几何精度上的限制。 算力瓶颈无处不在,当前3D高斯泼溅技术虽取得显著进展,却仍面临三大核心挑战:处理速度缓慢、计算成本高昂、几何精度有限。
4/14/2025 8:40:00 AM
量子位

激活具身智能创新加速度,九章云极DataCanvas公司领航CEAI 2025中国具身智能大会

‌近日,CEAI 2025中国具身智能大会在京圆满举办。 作为中国AI基础设施领军企业,九章云极DataCanvas公司以 “弹性算力 开发工具 智算云服务”的全栈技术布局惊艳亮相,直击具身智能企业在模型训练、算法迭代与场景落地中的核心痛点,加速普惠算力技术在具身智能领域的深度落地。 ‌具身智能迈入深水区:全链路能力成破局关键具身智能(Embodied AI)作为人工智能发展的新方向,强调智能体通过与环境交互实现自主学习与进化,其应用场景覆盖服务机器人、工业自动化、无人驾驶、智能穿戴设备等前沿领域。
4/2/2025 11:21:00 AM
新闻助手

北京最大单体智算集群亮相:规模突破 10000P,算力可顶 500 万台高性能笔记本

北京人工智能公共算力平台近日再次实现扩容,智算规模突破10000P,成为北京最大、国内领先的超大规模高性能单体智算集群,将有力支撑各类创新主体万亿参数级通用基础大模型一体化训练和推理。
3/3/2025 11:29:35 AM
清源

告别昂贵智算!京东云深圳放大招:八大王牌产品 五种部署模式,AI落地最后一公里全打通!

还在为高昂的智算成本和复杂的AI部署发愁?京东云在深圳城市大会上,用一连串重磅发布,给出了响亮的答案!他们一口气甩出八大“王炸”级智算新品,个个都号称“极致性价比”,直接瞄准企业在智能化转型中的痛点。 这架势,就是要让曾经高不可攀的AI技术,真正飞入寻常企业,成为提效增速的“新引擎”。 更给力的是,京东云还带来了五种“全场景”大模型部署模式,简直是为企业量身定制了五把“万能钥匙”。
2/26/2025 4:36:00 PM
AI在线