AI在线 AI在线

​AWS 在 AI 竞争中加码基础设施,SageMaker 平台迎来重大升级

亚马逊网络服务(AWS)对其机器学习和 AI 模型训练与推理平台 SageMaker 进行了重磅升级,旨在提升用户体验并增强其市场竞争力。 这一升级增加了新型可观察性功能、连接编码环境以及 GPU 集群性能管理等多项新特性。 SageMaker 平台自2024年起,已转变为一个统一的数据源集成中心,集成了多种机器学习工具。

亚马逊网络服务(AWS)对其机器学习和 AI 模型训练与推理平台 SageMaker 进行了重磅升级,旨在提升用户体验并增强其市场竞争力。这一升级增加了新型可观察性功能、连接编码环境以及 GPU 集群性能管理等多项新特性。

SageMaker 平台自2024年起,已转变为一个统一的数据源集成中心,集成了多种机器学习工具。此次更新的主要目标是帮助用户更清晰地了解模型性能下降的原因,同时提供更大的控制权来管理计算资源的分配。

AWS,亚马逊,云服务,Amazon,云计算,服务器

AWS 的 SageMaker 总经理 Ankur Mehrotra 在接受《VentureBeat》采访时表示,许多新功能的开发灵感均来源于用户反馈。他提到,开发生成 AI 模型的客户常常面临的问题是,当出现问题时,很难找到故障发生的具体层面。

为了帮助解决这一问题,SageMaker HyperPod 可观察性功能的引入,使得工程师能够检查计算层、网络层等各个层面的状况。一旦模型性能下降,系统能够即时发出警报,并在仪表盘上发布相关指标。

除了可观察性功能,SageMaker 还新增了本地集成开发环境(IDE)连接功能,允许工程师将本地编写的 AI 项目无缝部署到平台上。Mehrotra 指出,以前本地编码的模型只能在本地运行,这使得想要进行扩展的开发者面临不小挑战。现在,AWS 推出了安全远程执行功能,使得用户可以在本地或管理 IDE 上开发,并与 SageMaker 连接,灵活应对不同的任务。

AWS 在2023年12月推出了 SageMaker HyperPod,旨在帮助客户管理训练模型的服务器集群。HyperPod 能够根据需求模式调度 GPU 使用,帮助客户有效平衡资源和成本。AWS 表示,许多客户希望在推理任务中也能够实现类似的服务。由于推理任务通常在白天进行,而训练任务则多在非高峰时段进行,因此这一新功能将为开发者提供更大的灵活性。

虽然亚马逊在基础模型方面可能不如谷歌和微软那样引人注目,但 AWS 依然致力于为企业构建 AI 模型、应用或代理提供坚实的基础设施支撑。除了 SageMaker,AWS 还推出了 Bedrock 平台,专门为应用和代理的构建而设计。随着 SageMaker 的不断升级,AWS 在企业 AI 领域的竞争力愈加明显。

划重点:

🌟 AWS 对 SageMaker 平台进行重大升级,增加了可观察性和本地 IDE 连接功能。  

⚙️ SageMaker HyperPod 功能帮助用户更好地管理服务器集群,提高资源利用率。  

🚀 AWS 在 AI 基础设施领域的布局,将增强其在市场中的竞争优势。

相关资讯

AWS Intensifies Infrastructure in AI Competition, SageMaker Platform Receives Major Upgrade

AWS has made a major upgrade to its machine learning and AI model training and inference platform, SageMaker, aiming to enhance user experience and strengthen its market competitiveness. This upgrade adds new observability features, connection to coding environments, and GPU cluster performance management, among other new capabilities.Since 2024, the SageMaker platform has become a unified data source integration center, integrating various machine learning tools.
7/12/2025 6:41:50 PM
AI在线

亚马逊云科技展示Claude 3大模型能力,生成式AI落地正在加速

上周日,亚马逊云科技宣布 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。随着知名 AI 初创公司 Mistral AI、Anthropic 的前沿的大语言模型(LLM)陆续登陆 Amazon Bedrock,人们在构建生成式 AI 应用程序时,已经有了一系列先进模型的选择。
4/8/2024 7:47:00 PM
李泽南

谷歌宣布最新一届美国人工智能基础设施学院学员名单

谷歌近日宣布,第二届 “AI 基础设施学院” 正式启动,旨在支持初创企业利用人工智能技术解决网络安全、教育和交通等重要问题。 这一为期四个月的项目面向种子轮至 A 轮阶段的公司,提供无股权支持及丰富资源,包括领导力培训和销售技巧指导。 该项目的模式以虚拟为主,但选定的企业将有机会在谷歌总部参加一次面对面的峰会。
7/11/2025 2:41:02 PM
AI在线
  • 1