近期发现,k8s apiserver的内存和cpu定时(每隔10h)被客户一个控制器打的很高,有个小突刺。排查发现,用户的控制器开启了resyncPeriod,默认值就是10h
第一部分:Conda 的核心概念与操作运维管理 首先,要明确一个核心概念:Conda 是一个开源的包管理工具和环境管理工具。 包管理:它可以安装、更新
由于容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,ku
上篇我们分析了 hami-device-plugin-nvidia,知道了 HAMi 的 NVIDIA device plugin 工作原理。 本文为 HAMi 原理分析的第二
介绍 Argo CD 是一款适用于 Kubernetes 的声明式 GitOps 持续交付工具。 架构 Argo CD 是作为一个 Kubernetes 控制器来实现的,它能持
AI 赋能的云原生应用:技术趋势与实践 随着人工智能技术的飞速发展,云计算作为基础设施的角色日益重要。AI 与云计算的结合,正在催生新一代的云原生应用,为各行各业带来变革性的力
AI 赋能的故障排除:技术趋势与实践 随着人工智能技术的飞速发展,AI 在 IT 运维领域的应用日益广泛。AI 赋能的故障排除正在成为一种趋势,可以帮助 IT 团队更快、更准确
上篇我们分析了 hami-webhook,该 Webhook 将申请了 vGPU 资源的 Pod 的调度器修改为 hami-scheduler,后续使用 hami-schedu
在使用 Loki 配置警报时,若要在警报注释中添加原始日志内容,当前最佳实践是避免在警报通知中直接嵌入完整的日志行。这是因为 Loki 警报操作基于从日志派生的时间序列数据,而
在快速发展的IT行业,程序员需要不断学习和更新知识。构建和利用知识库,并结合人工智能(AI)技术,是提升程序员竞争力的关键。本文将探讨如何有效地利用知识库和学习资源,并结合AI
🔧 达梦数据库高可用集群部署方案 (CentOS 8, 6节点) 📝 方案概述 本方案旨在在6台同网段CentO
访问控制概述 Kubernetes作为一个分布式集群的管理工具,保证集群的安全性是其一个重要的任务。所谓的安全性其实就是保证对Kubernetes的各种客户端进行认证和鉴权操作
上篇我们分析了 hami-scheduler 工作流程,知道了 hami-webhook、hami-scheduler 是怎么配合工作的。 本文为 HAMi 原理分析的第四篇,
没有更多啦