AI在线 AI在线

DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

在今日凌晨的 AMD Advancing AI 2025 活动中,AMD 正式推出其下一代开源软件栈技术 ROCm 7,进一步加速 AI 与开发者生产力。

DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

随着 ROCm 7 的发布,AMD 终于从其 ROCm 6 软件栈向前迈进,该软件栈在过去几年中 —— 尤其是在 AI 计算出现以来 —— 已经经历了多次更新。以下是 AMD 在 ROCm 7 中重点关注的一些功能:

  • 最新算法与模型

  • 用于扩展 AI 的高级功能

  • MI350 系列支持

  • 集群管理

  • 企业级功能

DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

通过 ROCm,AMD 表示其正更加专注于其软件堆栈中日益增长的推理能力。ROCm 7 堆栈将包括增强型框架,如 vLLM v1、llm-d、SGLang,并专注于提供多种优化。即将到来的 ROCm 7 新内核和算法包括 GEMM 自动调优、MoE、Attention 和基于 Python 的内核编写。

AMD 已宣布对其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 也包含对这些高级数据类型的全面支持,如 FP8、FP6、FP4 和混合精度。

AI在线从发布会获悉,在性能方面,AMD 表示 ROCm 7 将推理作为重点,为 AI 工作负载带来了高达 3.5 倍的性能提升

具体来看,相较于 ROCm 6,ROCm 7 的 Llama 3.1 70B 提升了 3.2 倍,Qwen2-72B 提升了 3.4 倍,DeepSeek R1 提升了 3.8 倍

DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

相关资讯

AMD 发布 ROCm 6.1.3,支持 RX 7900 GRE 显卡及 TensorFlow

AMD 正式推出了最新的 ROCm(Radeon Open Compute)平台,宣布支持多 GPU 集群,例如双 RX 7900XTX 或 W7900 显卡、2 张或 4 张 PRO W7900 双槽工作站显卡。除此之外,ROCm 还支持了更多 RDNA3 显卡,包括 Radeon RX 7900 GRE,以及本月新推出的 PRO W7900 双槽工作站显卡,后者定价 3499 美元(IT之家备注:当前约 25433 元人民币)。除此之外,新版 ROCm 最重要的一点还在于增加了对 WSL 2 (Windows
6/20/2024 9:14:18 PM
问舟

调查:超72% 的企业选择 AI 工具时最看重易用性

根据最近的一项 CIO 报告,企业在人工智能(AI)领域的投资高达2.5亿美元,尽管在证明投资回报率(ROI)方面面临挑战。 商业领袖们正努力提高生产力,但新技术的集成往往需要重构现有应用、更新流程并激励员工学习,以适应现代商业环境。 QuickBlox 首席执行官 Nate MacLeitch 对136位高管进行了调查,以揭示 AI 采用的现实情况,探讨领导者的首要任务、主要担忧以及他们在2025年寻找可信工具的信息来源。
3/18/2025 10:02:00 AM
AI在线

可保护作品免遭 AI 训练,Adobe 推出 Content Authenticity 应用

Adobe 推出全新应用 Content Authenticity,用于保护创意工作者的作品署名权,即使有人截屏并在网络二次传播也不受影响。这款网页应用于今日面向公众开放测试,用户上传需要保护的图像,应用就能嵌入隐形元数据和添加“禁止 AI 训练”标签,帮助确认作品归属和保护作品免遭 AI 训练。
4/24/2025 9:32:18 PM
准泽(实习)
  • 1