Kubernetes
Kubernetes成本持续攀升,AI能否带来转机?
容器化应用在云端为企业带来诸多优势,但该行业一个鲜为人知的秘密是,管理这些应用的成本却并非优势之一。 根据最近的一项调查,绝大多数使用Kubernetes进行容器编排的企业在过去一年中花费更多,如今许多企业正转向AI来帮助控制成本。 Kubernetes管理供应商Spectro Cloud的调查显示,约88%的受访者表示其总拥有成本在过去一年中有所增长,而92%的受访者表示正在投资基于AI的成本优化工具。
8/21/2025 7:02:00 AM
Grant
Akamai 利用 AI 技术和 Kubernetes 平台实现云成本节省 70%
在当前的数字时代,云计算的开销持续高企,企业在计算资源的使用效率上普遍存在浪费。 根据最新统计,预计今年企业在不必要的云开销上将浪费高达445亿美元。 Akamai Technologies 作为一家大型的网络安全和内容交付服务提供商,面临着复杂的多云基础设施以及严格的安全合规要求,因此需要寻找有效的解决方案来优化云成本。
6/17/2025 11:02:12 PM
AI在线
我们如何构建了一个LangGraph代理以确定GitOps漏洞的优先级?
译者 | 布加迪审校 | 重楼一款基于LangGraph的开源工具可帮助你确定在特定的Kubernetes环境中最需要优先解决的漏洞。 在当今复杂的Kubernetes环境中,管理漏洞并确定优先级很快会变得令人不堪重负。 由于数十甚至数百个容器跨多个服务运行,你如何决定先处理哪些漏洞?
4/3/2025 8:33:59 AM
布加迪
大规模AI推理再非难事:如何在Kubernetes上部署DeepSeek
译者 | 核子可乐审校 | 重楼随着人工智能的持续发展,高效、大规模部署AI驱动应用程序变得至关重要。 而编排平台Kubernetes在管理容器化AI工作负载、确保可扩展性、弹性以及降低管理难度等方面,无疑将发挥不可替代的作用。 在本文中,我们将共同了解如何在Kubernetes上部署DeepSeek,运用其强大的AI推理模型DeepSeek-R1与Open WebUI集成以实现无缝交互。
3/28/2025 8:14:18 AM
核子可乐
一文读懂为什么 Kubernetes 中需要 DRA (动态资源分配)机制
在现代云原生架构中,Kubernetes 已经成为企业动态资源调度的核心技术。 随着业务需求的复杂性和多样性日益增加,如何高效地在 Kubernetes 集群中分配和调整资源,成为提升系统弹性和利用率的关键课题。 动态资源调度通过智能化地分配 CPU、内存、GPU 等关键资源,不仅能够满足不同负载的性能需求,还能降低资源浪费,提高基础设施的投资回报率。
12/27/2024 4:30:42 PM
Luga Lee
OpenAI的停机事件教会我们要构建更具弹性的系统
译者 | 李睿审校 | 重楼2024年12月11日, OpenAI公司提供的服务由于新部署的遥测服务出现问题而遭遇重大停机。 此次事件影响了API、ChatGPT和Sora服务,导致持续数小时的服务中断。 作为一家致力于提供准确高效的人工智能解决方案的供应商,OpenAI公司为此发布一份详细的事后分析报告,公开地讨论了出现问题的原因,以及他们如何计划防止在未来发生类似事件。
12/27/2024 4:03:38 PM
李睿
谷歌云更新 Kubernetes 引擎,可支持万亿参数的人工智能模型
生成式人工智能模型越来越大,参数已多达 2 万亿个,大型语言模型对计算和存储的需求也在增加。 谷歌云(Google Cloud)今天宣布升级旗下 Kubernetes 引擎的容量,以应对更大规模的模型,Kubernetes . 引擎的容量将从目前支持 15000 个节点集群升级到支持 65000 个节点集群。
11/15/2024 10:43:27 AM
如何使用Kubernetes合理调整GPU和CPU资源以训练和推理AI模型
译者 | 李睿审校 | 重楼如今,人工智能服务的迅速崛起创造了对计算资源的巨大需求,而如何有效管理这些资源成为一项关键挑战。 虽然使用Kubernetes运行人工智能工作负载已经取得了长足的进步,但基于动态需求优化调度仍然是一个亟待改进的领域。 在全球范围内,许多组织面临与GPU集群的成本和可用性相关的限制,并且通常依赖于这些计算集群来进行推理工作负载和持续的模型训练和微调。
11/14/2024 8:00:00 AM
李睿
- 1
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
英伟达
Anthropic
论文
代码
训练
算法
AI新词
Stable Diffusion
芯片
LLM
蛋白质
开发者
腾讯
苹果
Claude
生成式
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
百度
Sora
GPU
AI设计
华为
工具
大语言模型
RAG
搜索
具身智能
字节跳动
大型语言模型
场景
深度学习
预测
视频生成
伟达
视觉
Transformer
AGI
架构
亚马逊
神器推荐
Copilot
DeepMind
特斯拉
应用