当前位置: 首页 > news >正文

Kubernetes 常用运维命令整理

目录

      • Kubernetes 常用运维命令整理
        • 一、集群管理
        • 二、Pod 和容器管理
        • 三、Deployment 和应用管理
        • 四、Service 和网络管理
        • 五、存储管理
        • 六、ConfigMap 和 Secret 管理
        • 七、资源使用与监控
        • 八、调度和容错
        • 九、Role 和权限管理
        • 十、清理资源
      • 总结

Kubernetes 常用运维命令整理

Kubernetes 是一个强大的容器编排工具,用于管理和自动化应用的部署、扩展和管理。在日常运维中,掌握一些常用的 Kubernetes 命令非常重要,这样可以有效地管理和调试集群。本文将根据不同场景整理和区分 Kubernetes 运维常用命令,帮助大家更好地管理集群和应用。

一、集群管理
  1. 查看集群节点

    • 查看集群的所有节点信息:
      kubectl get nodes
      
    • 查看节点详细信息:
      kubectl describe node <node-name>
      
  2. 查看集群信息

    • 查看当前集群的基本信息(包括 API server 的地址等):
      kubectl cluster-info
      
  3. 检查节点状态

    • 检查节点的健康状况:
      kubectl get nodes -o wide
      
二、Pod 和容器管理
  1. 查看所有 Pod

    • 查看所有命名空间下的 Pod:
      kubectl get pods --all-namespaces
      
    • 查看当前命名空间下的 Pod:
      kubectl get pods
      
  2. 查看 Pod 状态

    • 查看指定 Pod 的详细信息:
      kubectl describe pod <pod-name>
      
    • 查看 Pod 的日志:
      kubectl logs <pod-name>
      
    • 查看指定容器日志:
      kubectl logs <pod-name> -c <container-name>
      
  3. 调试 Pod

    • 进入 Pod 容器进行调试:
      kubectl exec -it <pod-name> -- /bin/bash
      
  4. 删除 Pod

    • 删除指定 Pod:
      kubectl delete pod <pod-name>
      
三、Deployment 和应用管理
  1. 查看所有 Deployment

    • 查看所有命名空间下的 Deployment:
      kubectl get deployments --all-namespaces
      
  2. 查看 Deployment 状态

    • 查看指定 Deployment 的状态:
      kubectl describe deployment <deployment-name>
      
  3. 更新 Deployment

    • 更新 Deployment 使用新的镜像:
      kubectl set image deployment/<deployment-name> <container-name>=<new-image>
      
  4. 滚动更新

    • 进行滚动更新:
      kubectl rollout restart deployment <deployment-name>
      
  5. 回滚 Deployment

    • 回滚到上一个版本:
      kubectl rollout undo deployment <deployment-name>
      
四、Service 和网络管理
  1. 查看所有 Service

    • 查看所有命名空间下的 Service:
      kubectl get services --all-namespaces
      
  2. 查看 Service 详情

    • 查看指定 Service 的详细信息:
      kubectl describe service <service-name>
      
  3. 暴露应用

    • 暴露 Pod 作为一个服务:
      kubectl expose pod <pod-name> --type=LoadBalancer --name=<service-name>
      
  4. 查看端口映射

    • 查看集群端口映射:
      kubectl get svc
      
五、存储管理
  1. 查看所有 PersistentVolume (PV)

    • 查看所有 PV:
      kubectl get pv
      
  2. 查看所有 PersistentVolumeClaim (PVC)

    • 查看所有 PVC:
      kubectl get pvc
      
  3. 查看 Pod 使用的 PVC

    • 查看指定 Pod 使用的 PVC:
      kubectl describe pod <pod-name>
      
六、ConfigMap 和 Secret 管理
  1. 查看所有 ConfigMap

    • 查看所有 ConfigMap:
      kubectl get configmap
      
  2. 查看 ConfigMap 内容

    • 查看指定 ConfigMap 的内容:
      kubectl describe configmap <configmap-name>
      
  3. 查看所有 Secret

    • 查看所有 Secret:
      kubectl get secrets
      
  4. 查看 Secret 内容

    • 查看指定 Secret 的内容:
      kubectl describe secret <secret-name>
      
七、资源使用与监控
  1. 查看集群资源使用情况

    • 查看集群的资源使用情况:
      kubectl top nodes
      kubectl top pods
      
  2. 查看 Pod 资源请求和限制

    • 查看 Pod 的资源请求和限制:
      kubectl describe pod <pod-name>
      
  3. 启用集群的监控

    • 如果集群已经启用了 Prometheus 或其他监控工具,可以查看集群监控界面,检查集群健康状况和资源使用情况。
八、调度和容错
  1. 查看调度情况

    • 查看 Pod 是否被调度到节点:
      kubectl describe pod <pod-name> | grep Node
      
  2. 手动调度 Pod

    • 手动指定将 Pod 调度到特定节点:
      kubectl label node <node-name> disktype=ssd
      kubectl run <pod-name> --image=<image-name> --overrides='
      {"apiVersion": "v1","kind": "Pod","metadata": {"name": "<pod-name>"},"spec": {"nodeSelector": {"disktype": "ssd"}}
      }'
      
九、Role 和权限管理
  1. 查看 Role 和 RoleBinding

    • 查看所有的 Role 和 RoleBinding:
      kubectl get roles,rolebindings --all-namespaces
      
  2. 创建 Role 和 RoleBinding

    • 创建 Role 和 RoleBinding 以设置 Pod 的访问权限:
      kubectl apply -f role.yaml
      kubectl apply -f rolebinding.yaml
      
  3. 查看 ClusterRole 和 ClusterRoleBinding

    • 查看 ClusterRole 和 ClusterRoleBinding:
      kubectl get clusterroles,clusterrolebindings
      
十、清理资源
  1. 删除资源
    • 删除指定资源:
      kubectl delete <resource-type> <resource-name>
      

总结

本文整理了 Kubernetes 常用的运维命令,涵盖了集群管理、Pod 管理、应用管理、网络配置、存储、权限管理、资源监控等多个场景。在实际运维中,了解并熟练使用这些命令能够帮助我们高效管理集群,及时发现并解决问题,提高集群的稳定性和可用性。希望这篇整理能对你有所帮助。

相关文章:

  • 如何用大模型技术重塑物流供应链
  • 智慧景区国标GB28181视频平台EasyGBS视频融合应用全场景解决方案
  • CentOS 7上安装与配置Memcached及PHP客户端使用教程
  • 2025磐石行动第七周WP
  • 5.3.1 MvvmLight以及CommunityToolkit.Mvvm介绍
  • 【win11 安装WSL2 详解一遍过!!】
  • 什么是Wi-SUN?与其他低功耗广域网技术有何区别?
  • 人工智能与机器学习:二元分类决策树构建指南
  • 【Linux】基本指令(下)
  • 第十五届蓝桥杯 2024 C/C++组 拼正方形
  • PowerToys:让你的windows拥有更丝滑的体验
  • 天梯——L1-110 这不是字符串题
  • Redis高级数据类型解析(二)——Set、Sorted Set与Geo实战指南
  • Android面试题目基础总结(二)
  • Trae+DeepSeek学习Python开发MVC框架程序笔记(四):使用sqlite存储查询并验证用户名和密码
  • [golang] 介绍 | 特点 | 应用场景
  • elasticsearch查询中的特殊字符影响分析
  • 【Hive入门】Hive分区与分桶深度解析:优化查询性能的关键技术
  • 【前端】【业务场景】【面试】在前端开发中,如何实现一个可拖动和可缩放的元素,并且处理好边界限制和性能优化?
  • 【FAQ】针对于消费级NVIDIA GPU的说明
  • 中华人民共和国和肯尼亚共和国关于打造新时代全天候中非命运共同体典范的联合声明
  • 生态环境部:我国核电规模全球第一,总体安全可控
  • 上海市闵行区原二级巡视员琚汉铮接受纪律审查和监察调查
  • 土耳其发生6.2级地震,震源深度10千米
  • 福特中国CFO:依然坚信中国市场,上海帮助公司吸引到人才
  • 18米巨作绘写伏羲女娲,安徽展石虎最后十年重彩画