AI在线 AI在线

k8s

AIOps系列 | 开发 K8s GPT 故障诊断工具

前面我们介绍了 《开发 K8s Chat 命令行工具》,实现了通过和 Kubernetes 进行交互的方式进行运维,虽然文章中所描述的功能比较简单,但是可以以此进行扩展,丰富功能。 那本章,我们将在 《开发 K8s Chat 命令行工具》的基础之上,增加 Kubernetes 故障诊断工具,其主要功能点是:获取集群的 event 时间,特别关注 warning 级别事件然后进入对应的 pod 获取日志大模型结合事件和日志进行分析,得出解决问题的建议当然,这里也只是起到一个抛砖引玉的作用,提供简单的思路,可以自行扩展。 开发过程(1)首先使用 cobra-cli 新增一个 analyze 命令复制(2)然后在 analyze 下面添加一个子命令 event,专门用于分析事件复制(3)设计一个方法 getPodEventsAndLogs 用于获取 K8s 的事件和日志复制我们使用一个 map[string][]string 来保存 pod 的事件和日志信息,然后通过 client-go 获取 warning 级别的事件,最后过滤需要的 pod 事件以及 pod 相关信息,然后继续通过 client-go 获取对应 pod 的日志,然后把这些信息放到 map 中。
8/14/2025 1:11:00 AM
乔克

探索AI+k8s:如何使用Deepseek大模型增强k8s-dashboard

一、导读 Kubernetes(简称K8s)的普及让开发和运维工作变得更加高效,但它的复杂性却让许多人在使用时面临挑战。 从网络配置到故障排查,每一步都需要深入的技术积累。 然而,随着人工智能技术的迅猛发展,借助智能工具,我们可以将许多复杂问题简单化。
4/16/2025 3:25:00 AM
冬子先生
  • 1