AI在线 AI在线

Hot Chips 2025

FlashAttention-4震撼来袭,原生支持Blackwell GPU,英伟达的护城河更深了?

在正在举办的半导体行业会议 Hot Chips 2025 上,TogetherAI 首席科学家 Tri Dao 公布了 FlashAttention-4。 据介绍,在 Backwell 上,FlashAttention-4 的速度比英伟达 cuDNN 库中的注意力核实现快可达 22%! 在这个新版本的 FlashAttention 中,Tri Dao 团队实现了两项关键的算法改进。
8/26/2025 6:13:00 PM
机器之心
  • 1