成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

記一次 Kubernetes 排錯實戰

云計算
數據的不一致性(inconsistent)指對象的大小不正確、恢復結束后某副本出現了對象丟失的情況。數據的不一致性會導致清理失敗(scrub error)。

[[434523]]

背景

收到測試環境集群告警,登陸Kubernetes集群進行排查。

故障定位

查看Pod

查看kube-system node2節點calico pod異常。

查看詳細信息,查看node2節點沒有存儲空間,cgroup泄露。

查看存儲

登陸node2查看服務器存儲信息,目前空間還很充足。

集群使用到的分布式存儲為Ceph,因此查看Ceph集群狀態。

操作

Ceph修復

目前查看到Ceph集群異常,可能導致node2節點cgroup泄露異常,進行手動修復Ceph集群。

數據的不一致性(inconsistent)指對象的大小不正確、恢復結束后某副本出現了對象丟失的情況。數據的不一致性會導致清理失敗(scrub error)。

Ceph在存儲的過程中,由于特殊原因,可能遇到對象信息大小和物理磁盤上實際大小數據不一致的情況,這也會導致清理失敗。

數據的不一致性(inconsistent)指對象的大小不正確、恢復結束后某副本出現了對象丟失的情況。數據的不一致性會導致清理失敗(scrub error)。

Ceph在存儲的過程中,由于特殊原因,可能遇到對象信息大小和物理磁盤上實際大小數據不一致的情況,這也會導致清理失敗。

由圖可知,pg編號1.7c 存在問題,進行修復。

pg修復:

  1. ceph pg repair 1.7c 

進行修復后,稍等一會,再次進行查看,Ceph集群已經修復。

進行Pod修復

對異常Pod進行刪除,由于有控制器,會重新拉起最新的Pod。

查看Pod還是和之前一樣,分析可能由于Ceph異常,導致node2節點cgroup泄露,網上檢索重新編譯。

Google一番后發現與https://github.com/rootsongjc/kubernetes-handbook/issues/313這個同學的問題基本一致。存在的可能有:

  • Kubelet宿主機的Linux內核過低 - Linux version 3.10.0-862.el7.x86_64
  • 可以通過禁用kmem解決

查看系統內核卻是低版本。

故障再次定位

最后,因為在啟動容器的時候runc的邏輯會默認打開容器的kmem accounting,導致3.10內核可能的泄漏問題。

在此需要對no space left的服務器進行reboot重啟,即可解決問題,出現問題的可能為段時間內刪除大量的Pod所致。

初步思路,可以在今后的集群管理匯總,對服務器進行維修,通過刪除節點,并對節點進行reboot處理。

對node2節點進行維護

標記node2為不可調度

  1. kubectl cordon node02 

驅逐node2節點上的Pod

  1. kubectl drain node02 --delete-local-data --ignore-daemonsets --force 
  • --delete-local-data 刪除本地數據,即使emptyDir也將刪除;
  • --ignore-daemonsets 忽略DeamonSet,否則DeamonSet被刪除后,仍會自動重建;
  • --force 不加force參數只會刪除該Node節點上的ReplicationController,ReplicaSet,DaemonSet,StatefulSet or Job,加上后所有Pod都將刪除。

目前查看基本node2的Pod均已剔除完畢。

此時與默認遷移不同的是,Pod會先重建再終止,此時的服務中斷時間=重建時間+服務啟動時間+readiness探針檢測正常時間,必須等到1/1 Running服務才會正常。因此在單副本時遷移時,服務終端是不可避免的。

對node02進行重啟

重啟后node02已經修復完成。

對node02進行恢復:

恢復node02可以正常調度。

  1. kubectl uncordon node02 

反思

后期可以對部署Kubernetes集群內核進行升級。

集群內可能Pod的異常,由于底層存儲或者其他原因導致,需要具體定位到問題進行針對性修復。 

原文鏈接:https://juejin.cn/post/6969571897659015205

 

責任編輯:武曉燕 來源: 幽鬼
相關推薦

2021-11-27 18:50:55

Kubernetes邊緣計算

2021-05-26 11:06:06

Kubernetes網絡故障集群節點

2021-03-29 12:35:04

Kubernetes環境TCP

2021-08-20 11:35:04

服務運維 故障

2021-02-25 10:00:19

企業安全互聯網云平臺安全

2017-07-07 16:07:41

2014-08-11 09:31:52

2023-04-06 07:53:56

Redis連接問題K8s

2022-01-07 11:48:59

RabbitMQGolang 項目

2022-02-17 11:19:33

Kubernetes服務器運維

2020-12-29 10:25:07

漏洞JSONP注入

2013-01-17 10:31:13

JavaScriptWeb開發firebug

2023-10-10 12:05:45

2018-07-11 10:24:33

數據恢復數據刪除

2021-05-13 08:51:20

GC問題排查

2021-01-08 13:52:15

Consul微服務服務注冊中心

2017-12-19 14:00:16

數據庫MySQL死鎖排查

2019-08-26 09:50:09

2023-06-07 07:31:04

PC端app脫殼技巧

2013-04-01 10:27:37

程序員失業
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩欧美精品一区 | 女朋友的闺蜜3韩国三级 | 视频一区二区中文字幕日韩 | 理论片免费在线观看 | 孕妇一级毛片 | 国产成人精品在线 | 亚洲精品视频在线看 | 999精彩视频 | 国产成人免费视频网站视频社区 | 免费午夜电影 | 久久综合久久自在自线精品自 | 亚洲高清免费 | 国产精品久久久久9999鸭 | 99热这里都是精品 | 久久久久国产精品一区二区 | 亚洲精品一区二区网址 | 久草新在线 | 一级大片网站 | 日韩精品一区二区在线 | 久久久久久免费看 | 成人在线视频免费观看 | 久久久久久久久久久久91 | 超碰人人在线 | 伊人最新网址 | 精品亚洲一区二区 | 久久成人国产 | 久久视频精品 | 九九九视频在线观看 | 日本天堂视频 | www.一区二区三区 | 国产一区二区电影网 | 日韩精品免费 | 国产精品久久久久一区二区三区 | 久久小视频 | 亚洲一区二区在线播放 | 久久久免费| 国产在线观看网站 | 日韩中文字幕 | 国产成年人小视频 | 欧美一区二区免费 | 日本精品一区 |