AI在线 AI在线

EaaS

为MoE解绑:全新「专家即服务」推理架构发布,超细粒度扩展锐减37.5%成本

本文第一作者刘子铭为新加坡国立大学三年级博士生,本科毕业于北京大学,研究方向为机器学习系统中的并行推理与训练效率优化。 通信作者为上海创智学院冯思远老师和新加坡国立大学尤洋老师。 共同作者来自于上海奇绩智峰智能科技有限公司,北京基流科技有限公司等。
10/13/2025 1:03:00 PM
机器之心
  • 1