游客
标签:
排序:
最新发布 最近更新 最多浏览 最多点赞 最多评论
k8s控制器定时把k8s apiserver内存和cpu打得很高
近期发现,k8s apiserver的内存和cpu定时(每隔10h)被客户一个控制器打的很高,有个小突刺。排查发现,用户的控制器开启了resyncPeriod,默认值就是10h
2025年9月4日
Conda、Anaconda、Miniconda对比分析
第一部分:Conda 的核心概念与操作运维管理 首先,要明确一个核心概念:Conda 是一个开源的包管理工具和环境管理工具。 包管理:它可以安装、更新
2025年8月28日
K8s Pod 多种数据存储方式
由于容器的生命周期可能很短,会被频繁地创建和销毁。那么容器在销毁时,保存在容器中的数据也会被清除。这种结果对用户来说,在某些情况下是不乐意看到的。为了持久化保存容器的数据,ku
2025年7月25日
HAMi vGPU 原理分析 Part2:hami
上篇我们分析了 hami-device-plugin-nvidia,知道了 HAMi 的 NVIDIA device plugin 工作原理。 本文为 HAMi 原理分析的第二
2025年7月24日
Argo CD持续交付工具部署
介绍 Argo CD 是一款适用于 Kubernetes 的声明式 GitOps 持续交付工具。 架构 Argo CD 是作为一个 Kubernetes 控制器来实现的,它能持
2025年7月23日
AI 赋能的云原生应用:技术趋势与实践
AI 赋能的云原生应用:技术趋势与实践 随着人工智能技术的飞速发展,云计算作为基础设施的角色日益重要。AI 与云计算的结合,正在催生新一代的云原生应用,为各行各业带来变革性的力
2025年7月29日
AI 赋能的故障排除:技术趋势与实践
AI 赋能的故障排除:技术趋势与实践 随着人工智能技术的飞速发展,AI 在 IT 运维领域的应用日益广泛。AI 赋能的故障排除正在成为一种趋势,可以帮助 IT 团队更快、更准确
2025年7月30日
HAMi vGPU 原理分析 Part3:hami
上篇我们分析了 hami-webhook,该 Webhook 将申请了 vGPU 资源的 Pod 的调度器修改为 hami-scheduler,后续使用 hami-schedu
2025年8月1日
使用 Loki 配置告警,如何将原始日志内容添加告警到注释中?
在使用 Loki 配置警报时,若要在警报注释中添加原始日志内容,当前最佳实践是避免在警报通知中直接嵌入完整的日志行。这是因为 Loki 警报操作基于从日志派生的时间序列数据,而
2025年8月1日
知识库与AI:程序员的进阶之路
在快速发展的IT行业,程序员需要不断学习和更新知识。构建和利用知识库,并结合人工智能(AI)技术,是提升程序员竞争力的关键。本文将探讨如何有效地利用知识库和学习资源,并结合AI
2025年8月1日
达梦数据库高可用集群部署方案
🔧 达梦数据库高可用集群部署方案 (CentOS 8, 6节点) 📝 方案概述 本方案旨在在6台同网段CentO
2025年9月3日
K8s Pod 资源访问控制策略
访问控制概述 Kubernetes作为一个分布式集群的管理工具,保证集群的安全性是其一个重要的任务。所谓的安全性其实就是保证对Kubernetes的各种客户端进行认证和鉴权操作
2025年9月8日
HAMi vGPU 原理分析 Part4:Spread&Binpack 高级调度策略实现
上篇我们分析了 hami-scheduler 工作流程,知道了 hami-webhook、hami-scheduler 是怎么配合工作的。 本文为 HAMi 原理分析的第四篇,
2025年9月9日

没有更多啦

  • 复制图片
按住ctrl可打开默认菜单