首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
SAAS
ToB门户
了解全球最新的ToB事件
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
微博
Follow
记录
Doing
博客
Blog
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
排行榜
Ranklist
相册
Album
应用中心
qidao123.com ToB IT社区-企服评测·应用市场
»
论坛
›
软件与程序人生
›
DevOps与敏捷开发
›
如何优化k8s中HPA的弹性速率
返回列表
发新帖
如何优化k8s中HPA的弹性速率
[复制链接]
发表于 2024-4-7 10:14:44
|
显示全部楼层
|
阅读模式
本文分享自华为云社区《
K8s 核心资源指标HPA性能优化之路
》,作者:可以交个朋友。
一 背景
以弹性指标为cpu、memory为例。在Kubernetes 1.7
版本
中引入了聚合层,允许第三方应用程序注册相关
API
接口到kube-apiserver上。其中 /apis/metrics.k8s.io/v1beta1 一般由metrics-server程序提供,以插件的形式安装在K8s集群中。相关流程如下:
纵观整个链路如何优化HPA的弹性速率呢?
二 关键时间点分析
首先对于HPA controller
Kubernetes 将HPA pod自动扩缩实现为一个间歇运行的控制回路,间隔由kube-controller-manager的 --horizontal-pod-autoscaler-sync-period参数设置,默认间隔为15s。
然后kubelet指标汇总。kubelet提供指标端点:10250/metrics/resource 15刷新一次指标数据。
容器
指标由cadvisor负责采集,cAdvisor已经集成到kubelet程序当中。
metrics-server默认抓取时间为60s一次,60s的时间间隔内,kubelet的指标已经刷新4轮了,HPAcontroller也运行4轮了。
所以我们优化的思路可以从metrics-server程序入手,可以将HPA弹性响应速率提高45s左右。kube-controller-manager的参数不宜修改,设置过短会对集群控制面造成压力,产生过载风险。kubelet刷新指标间隔15s 同样也是一个合理且推荐的数值。
三 优化方案
metrics-server启动参数--metric-resolution可用于设置指标保留的时间。默认是60s,我们可以将该值设置为15s 加快pod资源指标的获取速率。
未修改指标保存时间前,查看metrics-server
日志
可以发现平均60s抓取一次指标
修改metrics-server
负载
配置
,添加启动参数
containers:
- command:
- /metrics-server
- --metric-resolution=15s # 添加该参数,加快指标更新速率
- --v=6 # 可设置
日志
级别,可以通过
日志
查看进程工作信息
- xxx
复制
代码
查看metrics-server日志发现抓取指标间隔为15s
四 验证过程
主要是对比优化该参数后,HPA弹性的速率是否提高。
基于
负载
app01创建伸缩策略,以cpu指标为例,HPA
配置
清单如下:
apiVersion: autoscaling/v2
kind: HorizontalPodAutoscaler
metadata:
name: app01
namespace: hu
spec:
scaleTargetRef:
apiVersion: apps/v1
kind: Deployment
name: app01
minReplicas: 1
maxReplicas: 10
metrics:
- type: Resource
resource:
name: cpu
target:
type: Utilization
averageUtilization: 50
复制
代码
4.1 优化前
对工作
负载
进行压测,探知HPAcontroller感知metrics的变化并观察HPA弹性的灵敏度
通过上图我们可以发现,HPA对指标变化感知滞后:
其中60s-90s区间内,指标数值一直为250%,未发生变化。实际情况是HPAcontroller已经运转三次,但是每次获取的指标均为250%。
4m-7m15s区间内,每隔60s HPA状态刷新一次,也就是说60s后 HPAcontroller才能感知下游服务的状态变化。可能大家也会有疑问,在执行 kubectl get xxx -w 的时候,每隔15s也刷新了一次数据,那是因为有其它value值发生了变化,例如REPLICAS值发生了变化,所以被记录了下来,并不是因为指标刷新触发的。
4.2 优化后
对工作负载进行压测,探知HPAcontroller感知metrics的变化并观察HPA弹性的灵敏度
通过上图我们可以发现,HPA对指标变化的获取提升明显,几乎每隔15s指标都会变化一次,如果获取的指标满足扩容条件则会立马扩容。
其中 60s-90s 区间内,其它选项保持不变(MINPODS、MAXPODS、REPLICAS),指标每隔15s就会刷新一次。HPA会根据当前获取的指标结合特定算法进行扩缩的实例的判断。
其中2m15s-4m 区间内,其它选项保持不变,指标固定每隔15s会刷新一次。可能大家会有疑问,明明指标已经达到扩容条件了,例如60s那个时间点,这就和HPA算法有关系了,如果存在未就绪状态或者不健康的pod,这些pod会被搁置掉不参与计算,所以75s那个时间,并未看到扩容行为。但是这些动作不与metrics指标层面冲突,metrics-server每隔15s上报一次指标,剩下具体的扩缩就是HPA controller该做的了。
点击关注,第一时间了解华为云新鲜技术~
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
回复
使用道具
举报
返回列表
浏览过的版块
信创/国产替代
Oracle
云原生
SAAS
.Net
网络安全
容器及微服务
数据仓库与分析
莫张周刘王
+ 我要发帖
登录后关闭弹窗
登录参与点评抽奖 加入IT实名职场社区
去登录
微信订阅号
微信服务号
微信客服(加群)
H5
小程序
快速回复
返回顶部
返回列表