AI在线 AI在线

AMD显卡性能飞跃!Stable Diffusion 模型迎来优化大提升

AMD 在 AI 领域的进展值得关注,尤其是其最新发布的针对 Stable Diffusion 模型的优化。 近日,Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本,这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著,最高可达3.8倍。 这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距,也为 AMD 用户带来了实实在在的好处。

AMD 在 AI 领域的进展值得关注,尤其是其最新发布的针对 Stable Diffusion 模型的优化。近日,Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本,这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著,最高可达3.8倍。这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距,也为 AMD 用户带来了实实在在的好处。

过去一年,AMD 与多个合作伙伴,包括操作系统供应商(OSV)、原始设备制造商(OEM)和独立软件开发商(ISV),在硬件设计、驱动程序、编译器和机器学习模型等方面紧密合作,致力于提高 AMD 硬件的 AI 应用性能。根据 AMD 的官方数据,经过一系列优化后,SDXL1.0和 SDXL Turbo 在 AMD 硬件上的推理性能较基础的 PyTorch 模型提升了3.8倍,而 SD3.5的性能提升则达到2.6倍。

image.png

在实际应用中,运行 SDXL1.0、SDXL Turbo、SD3.5Large 和 SD3.5Large Turbo 模型的 RX9070XT 显卡,其效率分别提升了3.1倍、1.5倍、3.3倍和2.1倍。与此同时,锐龙 AI MAX+395显卡在 SDXL1.0、SD3.5Large 和 SD3.5Large Turbo 的性能提升幅度分别为1.4倍、3.3倍和3.0倍。这样的性能改进让 AMD 显卡在图像和视频生成应用中表现更为出色。

此外,AMD 特别标注了优化版 Stable Diffusion 模型,使用 “_amdgpu” 后缀(例如:stable-diffusion-3.5-large_amdgpu),用户可以在 Stability AI 或 Hugging Face 平台上下载这一优化版本。同时,AMD 和 TensorStack AI 联合开发的 Amuse3.0版本也已上线,用户体验将更加流畅。值得注意的是,为了顺利使用这些优化模型,AMD GPU 驱动版本需不低于24.30.31.05的预览版,或等待即将发布的25.4.1正式版。

这一系列进展不仅提升了 AMD 显卡的 AI 应用能力,还为使用 AMD 硬件的开发者和用户带来了更多选择和灵活性。

相关资讯

编译 ONNX 模型

本篇文章译自英文文档Compile ONNX Models — tvm 0.13.dev0 documentation作者是 Joshua Z. Zhang更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文站。本文将介绍如何用 Relay 部署 ONNX 模型。首先安装 ONNX 包,最便捷的方法推荐安装 protobuf 编译器:或参考官方网站: ONNX 模型下面示例中的超分辨率模型与 ONNX
6/25/2023 6:06:00 PM
HyperAI超神经

将目标检测模型导出到C++|RT-DETR、YOLO-NAS、YOLOv10、YOLOv9、YOLOv8

最近,出现了更新的YOLO模型,还有RT-DETR模型,这是一个声称能击败YOLO模型的变换器模型,我想将这些模型导出并进行比较,并将它们添加到我的库中。 在这篇文章中,我将带你了解如何将这些模型导出到ONNX并运行它们,然后最终比较这些模型的速度。 将RT-DETR模型导出到ONNX这是从模型的GitHub页面获取的模型示例输出为了导出模型,我们需要从模型的GitHub仓库克隆代码()。
12/20/2024 2:32:54 PM
二旺

​黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。 该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。 多版本选择与平台支持BFL 推出了 FLUX.1Kontext 的三个版本:FLUX.1Kontext [pro]、FLUX.1Kontext [max] 以及即将进入私有测试阶段的 FLUX.1Kontext [dev]。
5/30/2025 10:01:14 AM
AI在线
  • 1