发布后机器负载高,如果不妥善处理很可能导致过载,使线上请求超时
防止局部机器过载
A. load balance算法使用的是动态负载均衡算法,例如负载最低优先算法。如此一来,重启后的机器负载高,相应进来的流量就少。
B. 自动化运维系统提供钩子,业务系统做好初始化动作(例如缓存预热)后调用钩子,运维系统此时才认为业务系统启动完成、放流量进来。
防止全局过载
如果连续重启很多机器,这些机器刚重启完cpu负载都高,可能导致整个集群过载,大量超时,有效吞吐急剧下降。
A. 人工控制重启节奏,分批重启,等重启后的机器cpu稳定了才重启下一批。
B. 同上面的B方案,自动化运维系统提供钩子,由自动化运维系统控制重启节奏。









网友评论