AI在线 AI在线

​AWS 在 AI 竞争中加码基础设施,SageMaker 平台迎来重大升级

亚马逊网络服务(AWS)对其机器学习和 AI 模型训练与推理平台 SageMaker 进行了重磅升级,旨在提升用户体验并增强其市场竞争力。 这一升级增加了新型可观察性功能、连接编码环境以及 GPU 集群性能管理等多项新特性。 SageMaker 平台自2024年起,已转变为一个统一的数据源集成中心,集成了多种机器学习工具。

亚马逊网络服务(AWS)对其机器学习和 AI 模型训练与推理平台 SageMaker 进行了重磅升级,旨在提升用户体验并增强其市场竞争力。这一升级增加了新型可观察性功能、连接编码环境以及 GPU 集群性能管理等多项新特性。

SageMaker 平台自2024年起,已转变为一个统一的数据源集成中心,集成了多种机器学习工具。此次更新的主要目标是帮助用户更清晰地了解模型性能下降的原因,同时提供更大的控制权来管理计算资源的分配。

AWS,亚马逊,云服务,Amazon,云计算,服务器

AWS 的 SageMaker 总经理 Ankur Mehrotra 在接受《VentureBeat》采访时表示,许多新功能的开发灵感均来源于用户反馈。他提到,开发生成 AI 模型的客户常常面临的问题是,当出现问题时,很难找到故障发生的具体层面。

为了帮助解决这一问题,SageMaker HyperPod 可观察性功能的引入,使得工程师能够检查计算层、网络层等各个层面的状况。一旦模型性能下降,系统能够即时发出警报,并在仪表盘上发布相关指标。

除了可观察性功能,SageMaker 还新增了本地集成开发环境(IDE)连接功能,允许工程师将本地编写的 AI 项目无缝部署到平台上。Mehrotra 指出,以前本地编码的模型只能在本地运行,这使得想要进行扩展的开发者面临不小挑战。现在,AWS 推出了安全远程执行功能,使得用户可以在本地或管理 IDE 上开发,并与 SageMaker 连接,灵活应对不同的任务。

AWS 在2023年12月推出了 SageMaker HyperPod,旨在帮助客户管理训练模型的服务器集群。HyperPod 能够根据需求模式调度 GPU 使用,帮助客户有效平衡资源和成本。AWS 表示,许多客户希望在推理任务中也能够实现类似的服务。由于推理任务通常在白天进行,而训练任务则多在非高峰时段进行,因此这一新功能将为开发者提供更大的灵活性。

虽然亚马逊在基础模型方面可能不如谷歌和微软那样引人注目,但 AWS 依然致力于为企业构建 AI 模型、应用或代理提供坚实的基础设施支撑。除了 SageMaker,AWS 还推出了 Bedrock 平台,专门为应用和代理的构建而设计。随着 SageMaker 的不断升级,AWS 在企业 AI 领域的竞争力愈加明显。

划重点:

🌟 AWS 对 SageMaker 平台进行重大升级,增加了可观察性和本地 IDE 连接功能。  

⚙️ SageMaker HyperPod 功能帮助用户更好地管理服务器集群,提高资源利用率。  

🚀 AWS 在 AI 基础设施领域的布局,将增强其在市场中的竞争优势。

相关资讯

AWS Intensifies Infrastructure in AI Competition, SageMaker Platform Receives Major Upgrade

AWS has made a major upgrade to its machine learning and AI model training and inference platform, SageMaker, aiming to enhance user experience and strengthen its market competitiveness. This upgrade adds new observability features, connection to coding environments, and GPU cluster performance management, among other new capabilities.Since 2024, the SageMaker platform has become a unified data source integration center, integrating various machine learning tools.
7/12/2025 6:41:50 PM
AI在线

OpenAI推出ChatGPT新功能,专注用户实用性而非点击量

据AIbase报道,OpenAI正为其旗舰产品ChatGPT推出一系列新功能,旨在提升其作为实用工具的价值,而非单纯追求用户参与度或点击量。 该公司表示,真正的成功在于用户是否愿意反复使用并从中学到东西。 通过提升工具的实用性,OpenAI相信用户将心甘情愿地付费。
8/5/2025 11:16:37 AM
AI在线

亚马逊云科技展示Claude 3大模型能力,生成式AI落地正在加速

上周日,亚马逊云科技宣布 Mistral AI 的 Mistral Large 模型在Amazon Bedrock上正式可用。随着知名 AI 初创公司 Mistral AI、Anthropic 的前沿的大语言模型(LLM)陆续登陆 Amazon Bedrock,人们在构建生成式 AI 应用程序时,已经有了一系列先进模型的选择。
4/8/2024 7:47:00 PM
李泽南
  • 1