一种基于Kubernetes的集群负载调节方法及存储介质

文档序号:25543395发布日期:2021-06-18 20:40阅读:来源:国知局

技术特征:

1.一种基于kubernetes的集群负载调节方法,其特征在于,包括以下内容:

对集群中的节点添加不同的标签,并将添加标签后的节点分配给不同的使用场景;

对同一使用场景中的节点的忙闲程度进行打分,得出所有节点的得分并计算得分平均值,统计得分低于得分平均值的节点得到忙碌节点;

将所述忙碌节点按得分升序排列,并对所述忙碌节点添加污点值;

根据所述污点值的添加情况对同一使用场景中的集群负载进行调节。

2.根据权利要求1所述的一种基于kubernetes的集群负载调节方法,其特征在于,所述对所述忙碌节点添加污点值包括:对排序靠前的忙碌节点添加第一污点值noscheduler,对剩余的忙碌节点添加第二污点值prefernoscheduler。

3.根据权利要求2所述的一种基于kubernetes的集群负载调节方法,其特征在于,所述将添加标签后的节点分配给不同的使用场景包括:当用户指定应用场景、提交训练需求并创建pod时,根据所述pod指定的信息,选择有相应标签的节点进行调度。

4.根据权利要求3所述的一种基于kubernetes的集群负载调节方法,其特征在于,不将所述pod调度到添加了第一污点值noscheduler的忙碌节点上,尽量不将所述pod调度到添加了第二污点值prefernoscheduler的忙碌节点上。

5.根据权利要求1所述的一种基于kubernetes的集群负载调节方法,其特征在于,所述对同一使用场景中的节点的忙闲程度进行打分的计算公式为:score(pi)表示第i个节点的性能得分,计算公式如下:

score(pi)=λcpu×ccpu×score(cpui)+λmemory×score(memoryi),其中,ccpu表示第i个节点的cpu核数,score(cpui)表示cpu频率,score(memoryi)表示内存大小,λcpu表示ccpu的权重,λmemory表示score(memoryi)的权重;

所述load(ni)表示总负载,计算公式如下:

load(ni)=λcpu×u(cpui)+λmemory×u(memoryi),其中,u(cpui)表示第i个节点的cpu使用量,为u(memoryi)表示内存使用量。

6.根据权利要求4所述的一种基于kubernetes的集群负载调节方法,其特征在于,根据所述污点值的添加情况对同一使用场景中的集群负载进行调节包括:将所述pod调度到未被添加污点值的节点上,直至集群达到负载均衡。

7.根据权利要求6所述的一种基于kubernetes的集群负载调节方法,其特征在于,根据所述污点值的添加情况对同一使用场景中的集群负载进行调节还包括:

集群进入新的负载情况后,删除为节点添加的污点值,继续监测负载并调度所述pod。

8.根据权利要求1所述的一种基于kubernetes的集群负载调节方法,其特征在于,所述方法还包括:定期监测集群中每个节点的忙闲程度。

9.根据权利要求8所述的一种基于kubernetes的集群负载调节方法,其特征在于,所述定期监测集群中每个节点的忙闲程度包括:根据使用需求设置节点计分时的权值因子以及计时器监控周期参数,定期检查集群中每个节点的负载情况。

10.一种存储介质,其特征在于,其上存储有执行权利要求1-9中任意一项所述一种基于kubernetes的集群负载调节方法的指令。


技术总结
本发明属于深度学习领域,具体公开了一种基于Kubernetes的集群负载调节方法及存储介质,方法包括:对集群中的节点添加不同的标签,并将添加标签后的节点分配给不同的使用场景;对同一使用场景中的节点的忙闲程度进行打分,得出所有节点的得分并计算得分平均值,统计得分低于得分平均值的节点得到忙碌节点并对忙碌节点添加污点值;根据污点值的添加情况对同一使用场景中的集群负载进行调节。本发明面向多团队共享GPU资源池这一应用场景,通过为节点添加标签划分不同的使用场景,确保不同团队能独占一部分节点,再通过周期性衡量集群的负载情况,使集群做到负载均衡,提高平台的稳定性与可用性。

技术研发人员:匡平;石华馨
受保护的技术使用者:电子科技大学
技术研发日:2021.02.25
技术公布日:2021.06.18
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1