Pod调度（指定节点、污点、亲和性）

作者: 小李飞刀_lql | 来源:发表于2021-11-15 06:43 被阅读0次

Pod调度（指定节点、污点、亲和性）
Kubernetes 亲和性调度
关于kubernates的Pod调度策略
K8s影响Pod调度相关
Kubernetes(八)亲和性与反亲和性
k8s调度之污点（Taints）和容忍度（Toleration
K8S-污点与污点容忍
k8s Affinity 亲和性专题源码分析 (二)
K8S之污点和容忍度
Kubernetes taints 配置

创建一个Pod的工作流程

工作流程图

1636811426331.png

Pod中影响调度的主要属性

资源调度依据

resources: {}

调度策略

schedulerName: default-scheduler
nodeName: ""
nodeSelector: {}
affinity: {}
tolerations: []

1636856892421.png

资源限制对Pod调度的影响

示例1 定义一个无法分配的pod

apiVersion: v1
kind: Pod
metadata:
  name: pod-resource2 
spec:
  containers:
  - name: web
    image: nginx
    resources:
      requests: 
        memory: "4Gi"
        cpu: "2000m"
        
------------------------------------------------------------------------------
[root@k8smaster pod]# kubectl apply -f pod-resource2.yaml 
pod/pod-resource2 created

#无法分配 有两种可能
#001 没有合适的节点分配资源
#002 正在拉取镜像
[root@k8smaster pod]# kubectl get pod
NAME            READY   STATUS    RESTARTS   AGE
pod-resource2   0/1     Pending   0          56s

#查看无法分配的原因，没有足够的内存
[root@k8smaster pod]# kubectl describe pod pod-resource2
0/2 nodes are available: 2 Insufficient memory. 

#查看node节点的分配状况
[root@k8smaster pod]# kubectl describe node k8snode1 

#可以分配的资源
Allocatable:
  cpu:                4
  ephemeral-storage:  15258982785
  hugepages-1Gi:      0
  hugepages-2Mi:      0
  memory:             2759772Ki
  pods:               110
#已经分配的资源
Allocated resources:
  (Total limits may be over 100 percent, i.e., overcommitted.)
  Resource           Requests    Limits
  --------           --------    ------
  cpu                550m (13%)  100m (2%)
  memory             200Mi (7%)  400Mi (14%)
  ephemeral-storage  0 (0%)      0 (0%)
  hugepages-1Gi      0 (0%)      0 (0%)
  hugepages-2Mi      0 (0%)      0 (0%)

示例2 资源限制

apiVersion: v1
kind: Pod
metadata:
  name: pod-resource 
spec:
  containers:
  - name: web
    image: nginx
    resources:
      requests:   # 容器最小资源配额
        memory: "64Mi"
        cpu: "250m"
      limits:     # 容器最大资源上限
        memory: "128Mi"
        cpu: "500m"
        
-----------------------------------------------------------------------------
[root@k8smaster pod]# kubectl apply -f pod-resource.yaml 
pod/pod-resource created
[root@k8smaster pod]# kubectl get pod
NAME           READY   STATUS    RESTARTS   AGE
pod-resource   1/1     Running   0          50s

nodeSelector & nodeAffinity

nodeSelector概述

001 用于将Pod调度到匹配Label的Node上，如果没有匹配的标签会调度失败
002 约束Pod到特定的节点运行
003 完全匹配节点标签

nodeSelector应用场景

001 专用节点：根据业务线将Node分组管理
002 配备特殊硬件：部分Node配有SSD硬盘、GPU

nodeSelector示例：确保Pod分配到具有SSD硬盘的节点上

给节点添加标签

格式：kubectl label nodes <node-name> <label-key>=<label-value>

[root@k8smaster pod]# kubectl label nodes k8snode1 disktype=ssd 
node/k8snode1 labeled

#验证
[root@k8smaster pod]# kubectl get nodes --show-labels |grep k8snode1
k8snode1    Ready    node     14d   v1.19.0   beta.kubernetes.io/arch=amd64,beta.kubernetes.io/os=linux,disktype=ssd,kubernetes.io/arch=amd64,kubernetes.io/hostname=k8snode1,kubernetes.io/os=linux,node-role.kubernetes.io/node=

#yaml

apiVersion: v1
kind: Pod
metadata:
  name: pod-nodeselector
spec:
  nodeSelector:
    disktype: "ssd"
  containers:
  - name: web
    image: nginx
    
------------------------------------------------------------------
[root@k8smaster pod]# kubectl get pod
NAME               READY   STATUS    RESTARTS   AGE
pod-nodeselector   1/1     Running   0          18s

001 只能分配到带有disktype: "ssd" 此标签的节点上


#yaml
apiVersion: v1
kind: Pod
metadata:
  name: pod-nodeselector2
spec:
  nodeSelector:
    gpu: "nvidia"
  containers:
  - name: web
    image: nginx
-----------------------------------------------------------------------
[root@k8smaster pod]# kubectl apply -f pod-nodeselector2.yaml 
pod/pod-nodeselector2 created

#无法分配
[root@k8smaster pod]# kubectl get pod
NAME                READY   STATUS    RESTARTS   AGE
pod-nodeselector2   0/1     Pending   0          10s

#原因
[root@k8smaster pod]# kubectl describe pod pod-nodeselector2
0/2 nodes are available: 2 node(s) didn't match node selector.

nodeAffinity概述

001 节点亲和性，与nodeSelector作用一样，但相比更灵活
002 优先分配符合条件的节点，实在不符合，可以将就
003 匹配有更多的逻辑组合，不只是字符串的完全相等
004 调度分为软策略和硬策略，而不是硬性要求
    • 硬（required）：必须满足
    • 软（preferred）：尝试满足，但不保证
005 操作符：In、NotIn、Exists、DoesNotExist、Gt、Lt

nodeAffinity示例1-软策略

apiVersion: v1
kind: Pod
metadata:
  name: pod-node-affinity
spec:
  affinity:
    nodeAffinity:
      #requiredDuringSchedulingIgnoredDuringExecution:
      #  nodeSelectorTerms:
      #  - matchExpressions:
      #    - key: gpu
      #      operator: In
      #      values:
      #      - nvidia-tesla
      preferredDuringSchedulingIgnoredDuringExecution:
      - weight: 1
        preference:
          matchExpressions:
          - key: gpu
            operator: In
            values:
            - nvidia
  containers:
  - name: web
    image: nginx
    
---------------------------------------------------------------------------
#虽然不符合要求，但是因为软策略，也将就运行
[root@k8smaster pod]# kubectl apply -f pod-node-affinity.yaml 
pod/pod-node-affinity created
[root@k8smaster pod]# kubectl get pod
NAME                READY   STATUS    RESTARTS   AGE
pod-node-affinity   1/1     Running   0          30s

nodeAffinity示例2-硬策略

apiVersion: v1
kind: Pod
metadata:
  name: pod-node-affinity2
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: gpu
            operator: In
            values:
            - nvidia
      #preferredDuringSchedulingIgnoredDuringExecution:
      #- weight: 1
      #  preference:
      #    matchExpressions:
      #    - key: gpu
      #      operator: In
      #      values:
      #      - nvidia
  containers:
  - name: web
    image: nginx
    
------------------------------------------------------------------------------
[root@k8smaster pod]# kubectl apply -f pod-node-affinity2.yaml 
pod/pod-node-affinity2 created
#无法分配
[root@k8smaster pod]# kubectl get pod
NAME                 READY   STATUS    RESTARTS   AGE
pod-node-affinity2   0/1     Pending   0          5s
#原因
[root@k8smaster pod]# kubectl describe pod pod-node-affinity2
0/2 nodes are available: 2 node(s) didn't match node selector.

Taint（污点）与Tolerations（污点容忍）

应用场景

001 专用节点：根据业务线将Node分组管理，希望在默认情况下不调度该节点，只有配置了污点容忍才允许分配
002 配备特殊硬件：部分Node配有SSD硬盘、GPU，希望在默认情况下不调度该节点，只有配置了污点容忍才允许分配
003 基于Taint的驱逐

给节点添加污点

格式：kubectl taint node [node] key=value:[effect] 

其中[effect] 可取值：
• NoSchedule ：一定不能被调度
• PreferNoSchedule：尽量不要调度，非必须配置容忍
• NoExecute：不仅不会调度，还会驱逐Node上已有的Pod

#添加污点
[root@k8smaster pod]# kubectl taint node k8snode1 gpu=yes:NoSchedule 
node/k8snode1 tainted
#查看污点
[root@k8smaster pod]# kubectl describe node k8snode1 |grep Taint  
Taints:             gpu=yes:NoSchedule

#去掉污点：
kubectl taint node [node] key:[effect]-
[root@k8smaster pod]# kubectl taint node k8snode1 gpu-
node/k8snode1 untainted
[root@k8smaster pod]# kubectl describe node k8snode1 |grep Taint  
Taints:             <none>

示例：测试污点及容忍污点

apiVersion: v1
kind: Pod
metadata:
  name: pod2
spec:
  containers:
  - name: web
    image: nginx
    
-------------------------------------------------------------------------------------
#无法分配
[root@k8smaster pod]# kubectl get pod
NAME   READY   STATUS    RESTARTS   AGE
pod2   0/1     Pending   0          7s
[root@k8smaster pod]# kubectl describe pod pod2
0/2 nodes are available: 1 node(s) had taint {gpu: yes}, that the pod didn't tolerate, 1 node(s) had taint {node-role.kubernetes.io/master: }, that the pod didn't tolerate.


#配置污点容忍
apiVersion: v1
kind: Pod
metadata:
  name: pod3
spec:
  tolerations:
  - key: "gpu"
    operator: "Equal"
    value: "nvidia"
    effect: "NoSchedule"
  containers:
  - name: web
    image: nginx
---------------------------------------------------------------------
#无法分配，因为值不匹配
[root@k8smaster pod]# kubectl get pod
NAME   READY   STATUS    RESTARTS   AGE
pod3   0/1     Pending   0          4s

#配置污点容忍
apiVersion: v1
kind: Pod
metadata:
  name: pod5
spec:
  tolerations:
  - key: "gpu"
    operator: "Equal"
    value: "yes"
    effect: "NoSchedule"
  containers:
  - name: web
    image: nginx

-------------------------------------------------------------------
[root@k8smaster pod]# kubectl apply -f pod5.yaml  
pod/pod5 created
#成功分配
[root@k8smaster pod]# kubectl get pod
NAME   READY   STATUS    RESTARTS   AGE
pod5   1/1     Running   0          29s

nodeName

示例

apiVersion: v1
kind: Pod
metadata:
  name: pod6
spec:
  nodeName: k8snode1
  containers:
  - name: web
    image: nginx
-------------------------------------------------------------
#k8snode1带有污点
[root@k8smaster pod]# kubectl describe node k8snode1 |grep Taint  
Taints:             gpu=yes:NoSchedule

[root@k8smaster pod]# kubectl apply -f pod6.yaml 
pod/pod6 created
#成功分配
[root@k8smaster pod]# kubectl get pod
NAME   READY   STATUS    RESTARTS   AGE
pod6   1/1     Running   0          5s

Pod调度（指定节点、污点、亲和性）
创建一个Pod的工作流程相关概念工作流程图 Pod中影响调度的主要属性资源调度依据调度策略资源限制对Po...
Kubernetes 亲和性调度
原文链接： Kubernetes 亲和性调度亲和性有分成节点亲和性(nodeAffinity)和 Pod 亲和性...
关于kubernates的Pod调度策略
Pod调度方式有，自动调度、定向调度、Node亲和性调度、Pod亲和性和互斥性调度自动调度：Deployment...
K8s影响Pod调度相关
调度方式定向调度亲和性调度污点与容忍 1. 定向调度 1.1 nodeName nodeName 用于强制约...
Kubernetes(八)亲和性与反亲和性
亲和性与反亲和性 nodeSelector 提供了一个非常简单的方式，将 Pod 调度限定到包含特定标签的节点上。...
k8s调度之污点（Taints）和容忍度（Toleration
1.理论详解 1.1 NodeAffinity节点亲和性，是在pod上定义的一种属性，使pod能够按照我们要求调度...
K8S-污点与污点容忍
Taints（污点）：避免Pod调度到特定的Node上Tolerations（污点容忍）: 允许Pod调度到持有T...
k8s Affinity 亲和性专题源码分析 (二)
前面文章一部分已有介绍Pod亲和性相关的调度策略算法分析，接下来我们继续Pod相关调度算法分析：三 POD亲和性...
K8S之污点和容忍度
污点 taints 是定义在node节点上的键值型属性数据，用于让节点拒绝将Pod调度运行于其上，除非Pod有接...
Kubernetes taints 配置
NodeAffinity节点亲和性，是Pod上定义的一种属性，使Pod能够按我们的要求调度到某个Node上，而Ta...