AI在线 AI在线

硬件

Mary Meeker最新报告:AI训练成本逼近百亿美元,推理成本暴跌 99%

知名投资人Mary Meeker最新AI报告揭示了行业一个关键矛盾:AI模型训练成本持续飙升至百亿美元级别,而推理成本却在硬件与算法突破下骤降99%,这种极端的成本结构分化正在重塑整个AI产业的商业化格局。 这份报告不仅展现了AI技术发展的壮观景象,更揭示了一个残酷现实:AI行业正在经历一场前所未有的资本密集型竞赛,只有少数头部玩家能够承担得起参与的门票。 训练成本:百亿级军备竞赛启幕Anthropic CEO Dario Amodei的最新预测令人震撼:2024年先进大语言模型的训练成本已达1亿美元,而部分在训模型的投入甚至接近10亿美元。
6/5/2025 3:00:56 PM
AI在线

郭明錤:OpenAI与io的AI硬件将在2027年上市

著名分析师郭明錤最近在一篇报告中透露,OpenAI 与科技公司 io 联合开发的新型 AI 硬件预计将在2027年进入量产阶段。 这款硬件的设计相当小巧,外形略大于当前流行的 AI Pin,类似于经典的 iPod Shuffle,便于用户携带。 值得一提的是,这款设备将会在越南进行组装,显示出制造业向东南亚转移的趋势。
5/23/2025 11:00:56 AM
AI在线

告别可穿戴!OpenAI秘密开发无屏幕AI设备,Altman称将成为第三大核心设备

OpenAI正在将目标从软件转向硬件领域。 据《华尔街日报》报道,OpenAI CEO Sam Altman周三在内部会议上向员工透露,公司下一个重大产品将不是可穿戴设备,而是一款具有革命性的紧凑型无屏幕设备。 全新设备概念与市场定位Altman向员工描述的这款设备能够完全感知用户周围环境,他将其定位为继MacBook Pro和iPhone之后的"第三大核心设备"。
5/23/2025 10:00:56 AM
AI在线

DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!

当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM

DeepSeek-V3 发布新论文,揭示低成本大模型训练的奥秘

近日,DeepSeek 团队发布了关于其最新模型 DeepSeek-V3的一篇技术论文,重点讨论了在大规模人工智能模型训练中遇到的 “扩展挑战” 以及与硬件架构相关的思考。 这篇长达14页的论文不仅总结了 DeepSeek 在开发 V3过程中的经验与教训,还为未来的硬件设计提供了深刻的见解。 值得注意的是,DeepSeek 的 CEO 梁文锋也参与了论文的撰写。
5/16/2025 9:00:55 AM
AI在线

Meta与佐治亚理工合作推出CATransformers框架 降低AI碳足迹

近日,Meta 的 FAIR 团队与佐治亚理工学院合作开发了 CATransformers 框架,旨在将碳排放作为 AI 系统设计的核心考量。 这一新框架通过联合优化模型架构和硬件性能,显著降低了 AI 技术的总碳足迹,为实现可持续的 AI 发展迈出了重要的一步。 随着机器学习技术的迅速普及,从推荐系统到自动驾驶等多个领域的应用不断增加,但其带来的环境代价同样不容忽视。
5/15/2025 11:01:54 AM
AI在线

Meta 推出 CATransformers 框架 助力AI行业实现减排目标

在人工智能迅猛发展的今天,Meta 的 FAIR 团队与佐治亚理工学院联合研发了一款名为 CATransformers 的全新框架。 该框架以降低碳排放为核心设计理念,旨在通过优化模型架构与硬件性能,显著减少 AI 技术在运营中的碳足迹,为可持续的 AI 发展奠定基础。 随着机器学习技术在各个领域的广泛应用,从推荐系统到自动驾驶,其背后的计算需求不断增加。
5/15/2025 9:01:02 AM
AI在线

神经形态计算:从实验室原型到产业变革的前夜

编辑 | matrix数十年来,科研人员一直致力于构建类脑计算机硬件,但这一领域尚未迎来真正的突破性进展。 如今,领先的研究者认为,构建首个能解决实际问题的规模化神经形态设备的时机已然成熟。 从仿生启发的潜力到技术深层的差异近年来推动人工智能进步的神经网络技术,虽从大脑中获得灵感,但其算法和硬件与生物神经元存在本质差异。
3/27/2025 12:01:00 PM
ScienceAI

用LLM做半导体设计,IBM&MIT提出受神经启发的LLM推理网络SOLOMON

编辑丨coisini尽管大型语言模型(LLM)擅长复杂推理,但在适应特定领域时仍面临挑战,尤其是在需要空间推理和解决结构化问题的领域。 半导体布局设计就是一个典型例子,AI 工具必须理解几何约束并确保组件的精确布局。 基于此,来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。
3/18/2025 11:59:00 AM
ScienceAI

阿里巴巴将于28日举办玄铁RISC-V生态大会 与DeepSeek有关

阿里巴巴集团在发布最新财报后,宣布将于2月28日举办一场重要论坛,由旗下达摩院主办,主题为“2025玄铁RISC-V生态大会”。 根据官方公布的议程,达摩院首席科学家将在会上发表题为《从Deepseek创新看RISC-V的机遇》的主题演讲,同时还将发布玄铁RISC-V系列芯片。 值得注意的是,阿里巴巴集团首席执行官吴泳铭于昨日上午宣布,公司计划在未来三年内投入超过3800亿元人民币,用于加强云计算和硬件基础设施建设,这一投入总额超过了过去十年在该领域的总和。
2/25/2025 11:09:00 AM
AI在线

消息称字节 AI 硬件团队首款自研产品为智能耳机,与豆包大模型联动

据晚点 LatePost 报道,字节正在探索将大模型与硬件结合,既自己开发 AI 硬件,也会与外部硬件公司合作。据称字节 AI 硬件团队的第一款产品为智能耳机,该款耳机将植入豆包大模型,并与字节 2023 年 8 月上线的对话类 AI 应用豆包 App 结合:戴上智能耳机后,用户可通过语音对话随时使用豆包,在豆包 App 上也可以操控这款耳机。据AI在线此前报道,字节跳动本月已完成对开放式耳机品牌 Oladance(主体公司:深圳大十未来科技有限公司)的收购,并实现 100% 控股。▲  Oladance 官网字节
9/10/2024 10:30:16 PM
沛霖(实习)

AI 图像生成公司 Midjourney 宣布进军硬件领域,苹果前硬件经理加盟

知名 AI 图像生成公司 Midjourney 宣布将涉足硬件领域,该公司今日在社交媒体 X 上发布消息,邀请人才加入其新成立的硬件部门。据AI在线了解,Midjourney 创始人 David Holz 曾任 Leap Motion 的首席技术官,具备丰富的硬件经验。近期,他招募了前 Leap Motion 同事 Ahmad Abbas 担任 Midjourney 硬件部门负责人。Abbas 曾在苹果公司工作过五年,担任硬件经理,参与了 Vision Pro 头显的研发。目前 Midjourney 尚未透露将开发
8/29/2024 8:19:04 AM
远洋

智平方打通具身智能核心痛点:将AGI拓展到物理世界

近日,清华大学五道口金融学院“金融PLUS系列产业峰会2024·人工智能赋能千行百业”盛大举办。智平方(深圳)科技有限公司(以下简称智平方)创始人兼CEO郭彦东博士受邀出席,并与工信部原副部长杨学山,中国科学院院士、清华大学人工智能研究院名誉院长张钹,百川智能创始人兼CEO王小川,易显智能创始人兼董事长马宏等参会嘉宾一道,同探讨人工智能赋能实体经济、推动实体经济高质量发展之路。第三代人工智能的发展趋势是从数字世界AGI到物理世界AGI大语言模型问世标志着第三代人工智能时代大幕开启,人工智能从特定领域、特定算法、完成
7/29/2024 3:15:00 PM
新闻助手

“看起来不像手机”,Altman和Jony Ive的AI硬件公司拟融资10亿美元

机器之能报道编辑:SiaJony Ive 和 Sam Altman 的 AI 设备初创公司正在与 Emerson Collective 和 Thrive Capital 进行融资谈判。Ive 希望筹集高达 10 亿美元的资金。据 The Information 独家消息,由前苹果设计师 Jony Ive 和 OpenAI CEO Sam Altman 创立的神秘 AI 硬件公司目前已经开始与一些最知名的风险投资公司进行融资谈判。The Information执行主编表示,它看起来不像手机据一位参与该过程的人士和另一
4/7/2024 11:28:00 AM
机器之能

OpenAI 将参与外部供应商设计流程,以获符合需求 AI 硬件

据英媒 Data Centre Dynamics 报道,OpenAI 正招募软硬件协同设计工程师,帮助外部供应商设计符合 OpenAI 自身需求的 AI 硬件。OpenAI 官网页面显示,该职位位于美国加州旧金山,将与其硬件工程师团队一同工作。对内,该职位需要同 OpenAI 内部的机器学习工程师、内核工程师、编译器开发人员合作,了解他们对高性能加速器在机器学习技术、算法、数值近似、编程表达性和编译器优化等方面的愿景和需求。对外,该职位需要同多个外部供应商一起实现 AI 硬件的性能和可编程性目标,并协同第三方开发最
3/8/2024 7:43:38 PM
溯波(实习)

「还是谷歌好」,离职创业一年,我才发现训练大模型有这么多坑

Karpathy:中肯的,一针见血的。如何在不到一年的时间里创办一家公司、筹集资金、购买芯片,并搭建出追赶 Gemini pro/GPT 3.5 的 LLM?很多人都对构建基础架构和训练大语言模型和多模态模型感到好奇,但真正走完「从零开始」这一流程的人很少。我们普遍认为,储备技术人才是前提,掌握核心算法是关键,但实际上,工程实践中冒出来的挑战,也实在令人头疼。一年前,乘着大模型的热潮,Yi Tay 离开了工作 3 年多的谷歌,参与创办了一家名为 Reka 的公司并担任首席科学家,主攻大型语言模型。在谷歌时,Yi T
3/7/2024 3:14:00 PM
机器之心

75岁Hinton中国大会最新演讲「通往智能的两种道路」,最后感慨:我已经老了,未来交给年轻人

「但我已经老了,我所希望的是像你们这样的年轻有为的研究人员,去想出我们如何能够拥有这些超级智能,使我们的生活变得更好,而不是被它们控制。」
6/12/2023 2:30:00 PM
机器之心

阿里 BladeDISC 深度学习编译器正式开源

作者:朱凯 - 机器学习PAI团队 随着深度学习的不断发展,AI模型结构在快速演化,底层计算硬件技术更是层出不穷,对于广大开发者来说不仅要考虑如何在复杂多变的场景下有效的将算力发挥出来,还要应对计算框架的持续迭代。深度编译器就成了应对以上问题广受关注的技术方向,让用户仅需专注于上层模型开发,降低手工优化性能的人力开发成本,进一步压榨硬件性能空间。阿里云机器学习PAI开源了业内较早投入实际业务应用的动态shape深度学习编译器 BladeDISC,本文将详解 BladeDISC的设计原理和应用。BladeDISC是什
3/30/2022 6:06:00 PM
阿里云大数据AI技术