AI在线 AI在线

红帽联手谷歌、NVIDIA启动llm-d开源项目,破解大规模AI推理成本与延迟双重难题

全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d,专门应对生成式AI大规模推理的迫切需求。 该项目汇聚了CoreWeave、Google Cloud、IBM Research和NVIDIA等行业巨头作为创始贡献者,旨在通过突破性技术让大语言模型推理云满足最严苛的生产服务级目标。 推理时代来临,挑战日益严峻根据Gartner最新数据预测,"到2028年,随着市场成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而非训练用途。

全球开源解决方案领导者红帽公司近日宣布启动革命性开源项目llm-d,专门应对生成式AI大规模推理的迫切需求。该项目汇聚了CoreWeave、Google Cloud、IBM Research和NVIDIA等行业巨头作为创始贡献者,旨在通过突破性技术让大语言模型推理云满足最严苛的生产服务级目标。

推理时代来临,挑战日益严峻

根据Gartner最新数据预测,"到2028年,随着市场成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而非训练用途。"这一趋势凸显了推理技术的战略重要性。

然而,随着推理模型复杂性和规模持续扩大,资源需求急剧攀升正在限制集中式推理的可行性。过高的成本和过长的延迟有可能成为AI创新发展的关键瓶颈,迫切需要新的技术解决方案。

机器人 AI 人工智能

llm-d:统一平台的创新突破

red帽及其合作伙伴通过llm-d项目直面这一挑战,成功将先进推理能力集成到现有企业IT基础设施中。该统一平台赋能IT团队在满足关键业务工作负载各种服务需求的同时,部署创新技术以最大化效率,并显著降低高性能AI加速器的总体拥有成本。

这一解决方案的核心价值在于打破了传统推理部署的局限性,为企业提供了更加灵活、高效且经济的AI推理选择。

强大的产业联盟支持

llm-d项目已获得由生成式AI模型提供商、AI加速器先驱和主要AI云平台组成的强大联盟支持。除了四家创始贡献者外,AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI等重要企业也作为合作伙伴加入该项目,展现了业界在构建大规模LLM服务未来方面的深度合作意愿。

行业领袖积极响应

Google Cloud AI与计算基础设施副总裁兼总经理Mark Lohmeyer强调:"在企业大规模部署AI并为用户创造价值的过程中,高效的AI推理至关重要。在我们进入推理新时代之际,Google Cloud很荣幸能够作为llm-d项目的创始贡献者,在我们开源贡献传统的基础上再接再厉。"

NVIDIA工程AI框架副总裁Ujval Kapasi表示:"llm-d项目是对开源AI生态系统的重要补充,体现了NVIDIA对合作推动生成式AI创新的承诺。可扩展、高性能的推理是下一波生成式AI和代理式AI的关键。我们正与红帽和其他支持合作伙伴合作,利用NIXL等NVIDIA Dynamo创新帮助加速llm-d的发展。"

开源驱动产业变革

llm-d项目的启动标志着AI推理领域进入新的发展阶段。通过开源模式汇聚产业智慧,该项目不仅有望解决当前大规模推理面临的成本和性能挑战,更将为整个AI生态系统的可持续发展奠定坚实基础。

随着更多企业和开发者的参与,llm-d有望成为推动AI推理技术标准化和普及化的重要力量,为即将到来的推理时代做好充分准备。

相关资讯

Intel 开源 AI Playground,可用intel Arc 显卡使用各种AI模型

Intel 宣布将其生成式 AI 软件 AI Playground 正式开源,这一举措引发了 AI 社区的广泛关注。 作为一款专为 Intel Arc GPU 和集成显卡优化的 AI 工具,AI Playground 被描述为一个“AI 中心”,支持本地运行聊天式大语言模型(LLM)以及图像和视频生成功能。 此次开源标志着 Intel 在推动生成式 AI 技术普及和社区协作方面迈出了重要一步。
4/21/2025 9:00:47 AM
AI在线

别再将LLM当成数据库了

译者 | 布加迪审校 | 重楼想象一下,你戴着耳机驾驶一辆汽车,每五分钟才更新一次路况信息,而不是持续不断地提供当前位置情况的视频流。 过不了多久,你就会撞车。 虽然这种类型的批处理在现实世界中并不适用,却是当今许多系统运行的方式。
1/3/2025 8:13:08 AM
布加迪

Omdia:预计中国生成式 AI 软件市场五年增超 4 倍,2029 年达 98 亿美元

市场调研机构Omdia今日发布报告称,经过两年的快速发展,2024 年中国的生成式人工智能(GenAI)软件收入已达到 18 亿美元(IT之家备注:当前约 131.18 亿元人民币)。
2/7/2025 12:43:44 PM
清源
  • 1