成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一次意想不到的pod內存驅逐問題

運維
處理項目上K8S集群pod驅逐問題也算不少了,不過此次產生pod驅逐的原因卻是意想不到,最后復盤原因很簡單,定位故障時候卻是忽略了,不過也算豐富了處理故障的案例。

案發現場

客戶現場反饋門戶網站無法打開,有很多pod狀態為Evicted

kubectl get pods -A | grep 0/1
 web-nginx-865674789f-c7bv4  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-ggb27  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-fwp94  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-djj46  0/1   Evicted       0   25m   <none>  192.168.3.10  <none>
 web-nginx-865674789f-dmhmp  0/1   OOmMKilled    0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-1v6x4  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-ct66c  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>
 web-nginx-865674789f-jk7ca  0/1   Evicted       0   25h   <none>  192.168.3.10  <none>

根據以往經驗,驅逐問題讓現場的實施同學查看監控,一般是磁盤或者內存會導致pod驅逐。客戶的磁盤一直很充足,所以排除

如果內存占用達到90%之上,就拿著監控找客戶擴容內存就好了

監控數據如下

圖片

圖片

節點內存為98G,故障時刻內存占用雖有上升,但是也在70%之下,看來此次問題并不如開始猜測的一樣

那么kubectl describe pods web-nginx-xxx查看日志(或者查看集群events事件,操作系統messages日志也)

圖片

從日志上可以看出來是內存不足導致了驅逐,問題在于我們沒有從監控上找到內存不足的證據。

破案

看來此次的問題和之前經驗并不相同 驅逐說明

我們來思考pod驅逐的原因。K8S通過kubelet來配置pod的驅逐參數,我們檢查下驅逐閾值

evictionHard:
  imagefs.available: "2Gi"
  memory.available: "200Mi"  #剩余200m才驅逐
  nodefs.available: "1Gi"
  nodefs.inodesFree: "5%"
evictionPressureTransitionPeriod: 5m0s  #設置kubelet離開驅逐壓力狀況之前必須要等待的時長。
.....
kubeReserved:  #給K8S組件運行預留的資源
  cpu: 400m
  memory: 800Mi
  ephemeral-storage: 300Mi
kubeReservedCgroup: /kube.slice
systemReserved: #非kubernetes組件預留資源
  memory: 3Gi
  cpu: 500m
  ephemeral-storage: 2Gi

從上面的配置來看,K8S可用內存=總內存-(3G+800m+200m)

通過kubectl describe node 192.168.3.10查看節點分配的總內存

Capacity:
  cpu:                16
  ephemeral-storage:  1047015936Ki
  hugepages-1Gi:      0
  hugepages-2Mi:      0
  memory:             65806460Ki
  pods:               253
Allocatable:
  cpu:                15400m
  ephemeral-storage:  1043358208Ki
  hugepages-1Gi:      0
  hugepages-2Mi:      0
  memory:             63242364Ki  #可分配60G內存
  pods:               253

Allocatable下的內存表示可分配的資源

圖片

60G和98G差了接近40G的資源,那么離真相已經很近了

和現場同學確認,問題出現前由于內存占用很高,做過一次在線擴容

故障復盤:故障原因為前期內存資源不足后,虛擬機采用在線擴容內存的方式,服務器沒有重啟,并且K8S的kubelet服務也沒有重啟,獲取到的內存配置仍然是60G,所以當主機內存達到60G的時候出現pod由于內存不足產生驅逐。

至于監控,node-exporter可以動態獲取主機物理資源,所以過于依賴監控卻忽略了檢查kubelet。

另外一個原因是之前擴容內存都是重啟服務器,忽略了這種異常場景

圖片

最后客戶重啟kubelet服務后,獲取到了新的配額,問題解決!

責任編輯:龐桂玉 來源: 運維之美
相關推薦

2022-08-02 15:04:36

JavaScript

2015-08-05 17:16:03

OpenStackUnitedstack

2017-06-01 16:20:08

MySQL復制延遲數據庫

2012-05-31 10:00:00

2022-10-11 14:39:18

泄露數據數據安全

2018-01-30 10:47:50

數據分析醫療保險數據科學

2012-04-26 14:34:22

HTML5

2020-08-25 13:22:07

數據可視化

2015-10-20 17:55:58

2016-04-06 11:29:10

京東云基礎云數據云

2017-01-20 13:37:40

大數據人工智能技術

2014-08-07 10:19:43

Android系統應用領域

2016-09-25 15:00:48

2011-08-02 09:31:52

SQL語句字符串

2017-05-19 10:55:19

DRaaS提供商災難恢復

2018-02-25 12:23:36

AI技術視頻網站

2018-10-12 13:53:22

2011-04-12 09:12:06

程序員

2010-04-09 15:12:49

中文SSID無線網絡設

2024-05-30 12:20:27

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人综合网 | 中文字幕日韩专区 | 日韩欧美在线免费观看视频 | 中文字幕 在线观看 | 作爱视频免费观看 | 久久久久久国产精品免费免费男同 | 黄色永久免费 | 91视频大全| 久久一| 男女网站免费观看 | av中文字幕网| 国产视频久 | 亚洲欧美日韩高清 | 一区二区高清在线观看 | 天天摸天天看 | 亚洲精品二区 | 蜜臀av日日欢夜夜爽一区 | 成人午夜免费福利视频 | 亚洲精品一区二区冲田杏梨 | 高清国产一区二区 | 日日骚网 | h在线播放 | 国产亚洲精品久久久久久豆腐 | 国产精品久久久久久久久久久免费看 | 狠狠躁天天躁夜夜躁婷婷老牛影视 | 激情 一区 | 99视频在线 | 国产午夜精品久久 | 国产在线精品免费 | 一区二区三区精品视频 | 欧美精品一区二区三区在线 | 99久久久99久久国产片鸭王 | 一级片免费视频 | 亚洲第一天堂无码专区 | 久久久国产一区二区三区四区小说 | 波多野结衣一二三区 | 综合久久网 | 亚洲国产aⅴ成人精品无吗 综合国产在线 | 麻豆av电影网 | 精品视频 免费 | 激情久久网 |