AIOps 生产落地实践:用 AI 提升告警质量与 K8S 运维效率
AI 大时代已然到来,身处浪潮之中,不得不思考如何不被时代浪潮抛下。本文将分享一个 AIOps 的落地实践:如何通过 AI 获取 K8S 的资源描述从而对 Prometheus 告警内容进行研判和分析。这是一次抛砖引玉的探索方案,后续可以由此衍生出 AI 自主处理告警事件。鉴于实现细节繁多,文中将侧重阐述核心思路和最终效果,而略去一些基础配置过程。AI 的发展速度实在太快,感叹一句:拥抱 AI,即拥抱未来!
More …AI 大时代已然到来,身处浪潮之中,不得不思考如何不被时代浪潮抛下。本文将分享一个 AIOps 的落地实践:如何通过 AI 获取 K8S 的资源描述从而对 Prometheus 告警内容进行研判和分析。这是一次抛砖引玉的探索方案,后续可以由此衍生出 AI 自主处理告警事件。鉴于实现细节繁多,文中将侧重阐述核心思路和最终效果,而略去一些基础配置过程。AI 的发展速度实在太快,感叹一句:拥抱 AI,即拥抱未来!
More … Cilium 的强大之处不仅在于其 eBPF 数据平面的高性能,更在于它提供了一整套从网络连接、安全策略到服务暴露的云原生解决方案。在《Cilium: 构建跨 BGP AS 域的 Kubernetes 集群网络》文中,展示了其原生的 BGP 能力如何打通 Pod 网络。在此之上,本文将焦点放在服务的暴露上。本文将展示如何利用 Cilium 内置的 IPAM 功能为 LoadBalancer 服务自动分配 IP,并探讨如何配置 BGP 和 L2 两种通告方式,让这些服务 IP 像 Pod IP 一样,无缝地集成到网络基础设施中,彻底告别手动的网络配置和复杂的外部负载均衡器。
More … 尽管 Cilium 以其基于 eBPF 的高性能 CNI 著称,但其能力远不止于集群内部。Cilium 原生的 BGP 功能,让 Kubernetes 集群能真正地参与到外部网络的路由决策中,这在很多混合云或本地数据中心的场景下,是个非常优雅的解决方案。利用 BGP 宣告集群的 Pod CIDR,构建一个无覆盖网络(No-Overlay)的高性能环境。这种模式下,Pod IP 可在外部网络直接路由,彻底消除了封装开销。本文将通过 ContainerLab 和 Kind 搭建实验,演示如何配置 Cilium 与外部路由器对接,从而将 Pod 网段宣告给物理网络。
More … 长期以来,基于 Netfilter 的 kube-proxy 都是 Kubernetes 服务网络的标准实现。但随着 eBPF 技术演进为强大的内核网络引擎,一个新机遇随之而来:我们能否彻底绕开 kube-proxy?Cilium 以其 eBPF 方案给出了肯定答案。实际上,绕过 Netfilter 本就是 Cilium 的一贯设计思路,此次替代方案亦不例外。它通过 Socket-LB 与 DSR 技术,在内核的 Socket 层构建了一套更高性能的负载均衡模型,为我们揭示了 K8s 网络的新可能。
More … 之前的一篇文章探讨了 Cilium 在 Native Routing 模式下的数据路径。然而,该模式对底层网络环境有特定要求,使其无法适用于所有场景,因此,不依赖底层网络、具有更强兼容性的 VXLAN 模式成为了一种重要的替代方案。VXLAN 会引入额外的封装与解封装开销,其具体实现过程值得关注:当数据包离开 Pod 时,eBPF 程序如何在内核中拦截该数据包,对其进行 VXLAN 封装,并最终将其发送至目标节点?本文旨在深入解析 Cilium VXLAN 模式的数据路径实现细节。
More … 随着云原生生态的发展,各种新技术、新项目层出不穷,而在容器网络领域,以 eBPF 为核心的 Cilium 已成为性能最强的容器网络方案之一,它显著提升了网络性能与可观测性。然而,eBPF 在带来强大的性能的同时,也带来了数据路径的复杂性。理解其内部工作原理对于故障排查至关重要。因此,本文旨在详细剖析 Cilium 原生路由模式的 eBPF 数据路径,阐明其报文转发流程,为生产实践提供参考。
More …