AI开发大一统:googleOpenXLA开源,整合任何框架和AI芯片

在去年 10 月的 Google Cloud Next 2022 活动中,OpenXLA 项目正式浮出水面,google与包含阿里巴巴、AMD、Arm、亚马逊、英特尔、英伟达等科技公司推动的开源 AI 框架合

在去年 10 月的 Google Cloud Next 2022 活动中,OpenXLA 项目正式浮出水面,google与包含阿里巴巴、AMD、Arm、亚马逊、英特尔、英伟达等科技公司推动的开源 AI 框架合作,致力于汇集不同机械进修框架,让机械进修开发人员获得能主动选择框架、硬件的能力。

本周三,google宣布 OpenXLA 项目正式开源。

图片

项目链接:https://github.com/openxla/xla

通过创建与多种不同机械进修框架、硬件平台共同工作的统一机械进修编译器,OpenXLA 可以加速机械进修应用的交付并供应更大的代码可移植性。对于 AI 研究和应用来说,这是一个意义重大的项目,Jeff Dean 也在社交网络上举行了宣传。

图片

如今,机械进修开发和部署受到碎片化的基础设施的影响,这些基础设施可能因框架、硬件和用例而异。这种相互隔绝限制了开发人员的工作速度,并对模型的可移植性、效率和生产化造成了障碍。

3 月 8 日,google等机构通过 OpenXLA 项目(其中包含 XLA、StableHLO 和 IREE 存储库)的开放,朝着消除这些障碍迈出了重要一步。

OpenXLA 是由 AI / 机械进修行业领导者共同开发的开源 ML 编译器生态系统,贡献者包含阿里巴巴、AWS、AMD、苹果、Arm、Cerebras、google、Graphcore、Hugging Face、英特尔、Meta 和英伟达。它使得开发人员能够编译和优化来自任何领先机械进修框架的模型,以便在各种硬件上举行高效训练和服务。应用 OpenXLA 的开发人员可以观察到训练时间、吞吐量、服务延迟以及最终发布和计算成本方面的明显提升。

机械进修技术设施面临的挑战

随着 AI 技术进入实用阶段,许多行业的开发团队都在应用机械进修来应对现实世界的挑战,例如举行疾病的预测和预防、个性化进修体验和黑洞物理学探索。

随着模型参数数量呈指数级增长,深度进修模型所需的计算量每六个月翻一番,开发人员正在寻求基础架构的最大功能和利用率。大量团队正在利用多型号种类的硬件,从数据中心中的节能机械进修专用 ASIC 到可以供应更快响应速度的 AI 边缘处理器。相应的,为了提高效率,这些硬件设置装备摆设应用定制化的独特算法和软件库。

但另一方面,如果没有通用的编译器将不同硬件设置装备摆设桥接到当今应用的多种框架(例如 TensorFlow、PyTorch)上,人们就需要付出大量努力才能有效地运行机械进修。在实际工作中,开发人员必须手动优化每个硬件目标的模型操作。这意味着应用定制软件库或编写特定于设置装备摆设的代码需要领域专业知识。

这是一个矛盾的结果,为了提高效率应用专用技术,结果却是跨框架和硬件的孤立、不可概括的路径导致维护成本高,进而导致供应商锁定,减缓了机械进修开发的进度。

解决方法和目标

OpenXLA 项目供应了最先进的 ML 编译器,可以在 ML 基础设施的复杂性中举行扩张。它的核心支柱是功能、可扩张性、可移植性、灵活性和易用性。借助 OpenXLA,我们渴望通过加速人工智能的开发和交付来实现 AI 在现实世界中的更大潜力。

OpenXLA 的目标在于:

通过适用于任何框架,接入专用设置装备摆设后端和优化的统一编译器 API,使开发人员可以轻松地在他们的首选框架中针对各种硬件编译和优化任何模型。

为当前和新兴模型供应行业领先的功能,也可扩张至多个主机和加速器满足边缘部署的限制,并推广到未来的新型模型架构上。

构建一个分层和可扩张的机械进修编译器平台,为开发人员供应基于 MLIR 的组件,这些组件可针对其独特的用例举行重新配置,用于硬件定制化编译流程。

AI/ML 领导者社区

我们今天在机械进修基础架构中面临的挑战是巨大的,没有任何一个组织可以单独有效地解决这些挑战。OpenXLA 社区汇集了在 AI 堆栈的不同级别(从框架到编译器、runtime 和芯片)上运行的开发人员和行业领导者,因此非常适合解决我们在 ML 领域看到的碎片化问题。

作为一个开源项目,OpenXLA 遵循以下原则:

平等地位:个人无论从属关系如何,都平等地做出贡献。技术领导者是那些贡献最多时间和精力的人。

尊重文化:任何成员都应维护项目价值观和行为准则,无论他们在社区中的职位如何。

可扩张、高效的治理:小团队做出基于共识的决策,具有清晰但很少应用的升级路径。

透明度:任何决定和理由都应该对公众清晰可见。

OpenXLA 生态系统:功能、规模和可移植能力

OpenXLA 通过模块化工具链消除了机械进修开发人员的障碍,它通过通用编译器接口得到任何领先框架的支持,利用可移植的标准化模型表示,并供应具有强大的目标向和特定硬件优化的特定领域编译器。该工具链包含 XLA、StableHLO 和 IREE,任何这些工具都利用 MLIR:一种编译器基础架构,使机械进修模型能够在硬件上一致地表示、优化和执行。

图片

OpenXLA 主要亮点

机械进修用例的范围

OpenXLA 当前的应用涵盖了 ML 用例的范围,包含在阿里云上对 DeepMind 的 AlphaFold、GPT2 和 Swin Transformer 等模型举行全面训练,以及在 Amazon.com 上举行多模态 LLM 训练。Waymo 等客户利用了 OpenXLA 举行车载实时推理。此外,OpenXLA 还用于优化配备 AMD RDNA™ 3 的本地机械上的 Stable Diffusion 服务。

最佳功能,开箱即用

OpenXLA 使开发人员无需编写特定于设置装备摆设的代码,即可轻松加快模型功能。它具有整体模型优化功能,包含简化代数表达式、优化内存数据布局以及改进调度以减少峰值内存应用和通信开销。高级算子融合和内核生成有助于提高设置装备摆设利用率并降低内存带宽要求。

轻松扩张工作负载

开发高效的并行化算法非常耗时并且需要专业知识。借助 GSPMD 等功能,开发人员只需注释关键张量的一个子集,然后编译器就可以应用这些子集自动生成并行计算。这消除了跨多个硬件主机和加速器对模型举行分区和高效并行化所需的大量工作。

便携性和可选性

OpenXLA 为多种硬件设置装备摆设供应开箱即用的支持,包含 AMD 和 NVIDIA GPU、x86 CPU 和 Arm 架构以及 ML 加速器,如 Google TPU、AWS Trainium 和 Inferentia、Graphcore IPU、Cerebras Wafer-Scale Engine 等等。OpenXLA 还通过 StableHLO 支持 TensorFlow、PyTorch 和 JAX,StableHLO 是一个用作 OpenXLA 输入格式的可移植层。

灵活性

OpenXLA 为用户供应了手动调整模型热点的灵活性。自定义调用等扩张机制应用户能够用 CUDA、HIP、SYCL、Triton 和其他内核语言编写深度进修原语,从而能够充分利用硬件特性。

StableHLO

StableHLO 是 ML 框架和 ML 编译器之间的一个可移植层,是一个支持动态、量化和稀疏性的高级运算(HLO)的运算集。此外,它可以被序列化为 MLIR 字节码以供应兼容性保证。任何主要的 ML 框架(JAX、PyTorch、TensorFlow)都可以产生 StableHLO。2023 年,google计划与 PyTorch 团队紧密合作,实现与 PyTorch 2.0 版本的整合。

参考内容:

https://opensource.googleblog.com/2023/03/openxla-is-ready-to-accelerate-and-simplify-ml-development.html?m=1

Google reveals what’s next for Cloud AI

原创文章,作者:机器之心,如若转载,请注明出处:https://www.iaiol.com/news/32332

(0)
上一篇 2023年3月13日 下午3:36
下一篇 2023年3月13日 下午4:02

相关推荐

  • 这个夏天,跟陈天奇学「机械进修编译」中英文课程,6月17日开课!

    陈天奇:「因为世界上还没有关于这个方位的零碎性课程,所以这一次尝试应该会是和小伙伴们共同的探索」。随着机械进修框架和硬件需求的发展,机械进修 / 深度进修编译正成为一个越来越受关注的话题。在去年 12

    2022年6月4日
  • 降低门槛,全平台应用,昇腾还会手把手地教你如何用AI

    机器之心报道作者:泽南如何才能做到 AI 应用一次开发,全场景部署?昇腾给出了答案。如今的大多数 AI 应用程序都需要跑在多种类型的处理器上,覆盖数十个版本的操作系统,运行在从端侧到云计算集群的各种设

    2021年3月19日
  • 情形智能平台:多模态一体化人工智能开源框架

    编者按:如何建立能够实时感知、理解并在人类世界中行动的人工智能体系?事实上,要建立这样的体系需要组合和协调不同的人工智能技术,将多种人工智能技术(如机器学习、计算机视觉、语音识别、自然语言处置和对话管理等)结合在一起。最近,微软研究院推出的情形智能平台(Platform for Situated Intelligence)致力于提供完整的开发套件,能大大提高运用开发及相关研究的效率,或许在一定程度上推动了该问题的解决。本文编译自微软研究院博客文章 “Platform for Situated Intelligence: An open-source framework for multimodal, integrative AI”。

    2020年10月19日
  • 是时候进修机械进修零碎设想了!斯坦福CS 329S开课,课件、笔记同步更新

    这是一门新的课程——在进修了算法、框架等内容后,是时候深入了解一下「机械进修零碎设想」了!

    2021年1月26日

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注