成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

記一次艱難的GC問題排查!

運維 網(wǎng)絡(luò)運維
最近在我的項目中就出現(xiàn)了一個比較奇葩的gc問題,排查過程比較繁瑣,所以在這里分享一下這個整個排查過程,希望對大家有一定的幫助。

[[399235]]

本文轉(zhuǎn)載自微信公眾號「咖啡拿鐵」,作者咖啡拿鐵。轉(zhuǎn)載本文請聯(lián)系咖啡拿鐵公眾號。

 背景

gc問題一直是一個很難排查的問題,但是他又是一個經(jīng)常在我們開發(fā)業(yè)務(wù)中出現(xiàn)的。這不,最近在我的項目中就出現(xiàn)了一個比較奇葩的gc問題,排查過程比較繁瑣,所以在這里分享一下這個整個排查過程,希望對大家有一定的幫助

排查過程

確定GC出問題

在某一天的上午突然出現(xiàn)了報警,發(fā)現(xiàn)是ZK斷開了鏈接,

從圖上看我們這個錯誤是間斷性的出現(xiàn),最開始以為是zk出現(xiàn)了問題,后來經(jīng)過排查其他服務(wù)的zk并沒有出現(xiàn)任何問題。所以就懷疑是內(nèi)部的代碼出現(xiàn)問題導(dǎo)致的,研究之后發(fā)現(xiàn)是zk出現(xiàn)了心跳超時情況才導(dǎo)致的斷開鏈接,所以就懷疑了兩種情況:

  • 網(wǎng)絡(luò)有抖動
  • 機器間歇性卡死

如果網(wǎng)絡(luò)有抖動的話的確是會出現(xiàn)偶發(fā)性超時,但是很明顯,其他所有的服務(wù)都沒問題,應(yīng)該不是抖動導(dǎo)致。所以機器應(yīng)該是間歇性的一個卡死,一般出現(xiàn)這個情況首當(dāng)其沖的就是我們CPU被打滿了,導(dǎo)致機器卡死,發(fā)現(xiàn)CPU并無問題,然后就是我們的gc帶來的STW,會導(dǎo)致我們的jvm進(jìn)程卡頓。

觀察之后的確是young gc很慢,導(dǎo)致我們的JVM發(fā)生了GC卡頓,所以出現(xiàn)了這個現(xiàn)象。

排查原因

GC出現(xiàn)問題一般來說兩大法寶可以解決大部分問題:

  • GC日志
  • dump文件

出現(xiàn)問題之后我立馬打開了GC日志,截圖如下:

可以發(fā)現(xiàn)我們的young gc已經(jīng)達(dá)到2.7s了,大家知道我們的young gc是全程STW的,那就意味著每次gc就會卡頓2.7s,那么zk超時斷開鏈接也就符合正常了。再看了下這個gc收集情況,每次也能完全收集。在日志中很明顯在root scanning的時間比較長,當(dāng)時對這個階段不太熟悉(后面會繼續(xù)講),所以一直也不明白為什么這樣,在網(wǎng)上各種搜索,也沒有結(jié)論。

這個時候我在why哥公眾號讀到了一篇文章:https://mp.weixin.qq.com/s/KDUccdLALWdjNBrFjVR74Q, 建議大家可以閱讀一下這篇文章,這個文章中主要談到了我們jvm的一個優(yōu)化,大家都知道我們進(jìn)入STW的時候是需要一個安全點才可以的,而詢問是否進(jìn)入到安全點是需要耗費資源的,所以jvm在做jit優(yōu)化的時候會講counted loop 也就是計數(shù)循環(huán)優(yōu)化成整個循環(huán)結(jié)束之后再進(jìn)入安全點,在小米的技術(shù)文章中也提到了相關(guān)的問題:《HBase實戰(zhàn):記一次Safepoint導(dǎo)致長時間STW的踩坑之旅》 。

看完這兩個文章之后,我突然想到了我們的代碼也是counted loop的形式,所以就懷疑有可能也是這個問題導(dǎo)致的,馬上進(jìn)行代碼優(yōu)化,將for(int i = 0; i< n; i++) 中的int 換成了long,就可以避免這種jit的優(yōu)化,馬上興沖沖的將其上線,結(jié)果過了一天之后依然存在這個問題,此時人都快崩潰,搞了半天原來不是這個問題導(dǎo)致的。

定位問題

對于G1之前只是看了些原理相關(guān)的,但是此時原理相關(guān)的東西好像在這里基本沒啥用,所以我決定系統(tǒng)性的學(xué)習(xí)一下,這里我選擇的是《jvm G1源碼分析和調(diào)優(yōu)》這本書,在讀到5.4節(jié)的時候:

發(fā)現(xiàn)有兩個之前沒有見過的參數(shù),一個是G1LogLevel,一個是UnlockExperimentalVMOptions,從解釋說明上來看配置了之后能獲取到更加詳細(xì)的YGC日志,于是加上了這個參數(shù)然后繼續(xù)觀察,日志格式太長,只截取了部分日志信息,有興趣的可以下來自己打印一下:

可以發(fā)現(xiàn)在SystemDictionary Roots階段是比較慢的,但是這個又是啥玩意呢?在書里面是沒有任何介紹的,于是又進(jìn)行大量谷歌,終于是找到了一篇你假笨寫的一篇文章:JVM源碼分析之自定義類加載器如何拉長YGC,強烈推薦大家讀完這篇文章。

好了最后我來盤一盤到底為什么會出現(xiàn)gc慢的問題呢?我們這個定時任務(wù)是一個定時查詢微信退款信息的,微信的退款信息需要解析XML,就有如下代碼:

而我們的罪魁禍?zhǔn)灼鋵嵕驮谶@個new XStream這個方法中,我們的默認(rèn)構(gòu)造方法會調(diào)用下面的這個構(gòu)造方法:

需要注意的是我們每次創(chuàng)建一個XStream都會新創(chuàng)建一個ClassLoader,先解釋一下ClassLoader,這里直接引用你假笨的一段話:

這里著重要說的兩個概念是初始類加載器和定義類加載器。舉個栗子說吧,AClassLoader->BClassLoader->CClassLoader,表示AClassLoader在加載類的時候會委托BClassLoader類加載器來加載,BClassLoader加載類的時候會委托CClassLoader來加載,假如我們使用AClassLoader來加載X這個類,而X這個類最終是被CClassLoader來加載的,那么我們稱CClassLoader為X類的定義類加載器,而AClassLoader為X類的初始類加載器,JVM在加載某個類的時候?qū)ClassLoader和CClassLoader進(jìn)行記錄,記錄的數(shù)據(jù)結(jié)構(gòu)是一個叫做SystemDictionary的hashtable,其key是根據(jù)ClassLoader對象和類名算出來的hash值(其實是一個entry,可以根據(jù)這個hash值找到具體的index位置,然后構(gòu)建一個包含kalssName和classloader對象的entry放到map里),而value是真正的由定義類加載器加載的Klass對象,因為初始類加載器和定義類加載器是不同的classloader,因此算出來的hash值也是不同的,因此在SystemDictionary里會有多項值的value都是指向同一個Klass對象。

我們把這個放到我們的場景來看就是下面這個情況:

由于我們每次請求都會新創(chuàng)建一個Xstream對象,從而也會新創(chuàng)建一個ClassLoader,由于我們的ClassLoader的key是根據(jù)每個對象來算出來的hash值,如果每次都新創(chuàng)建,自然hash值不一樣,從而導(dǎo)致我們有很多ClassLoader指向XStream這個class。為什么SystemDictionary的大小會影響我們GC時間呢?

想象一下這么個情況,我們加載了一個類,然后構(gòu)建了一個對象(這個對象在eden里構(gòu)建)當(dāng)一個屬性設(shè)置到這個類(static變量)里,如果gc發(fā)生的時候,這個對象是不是要被找出來標(biāo)活才行,那么自然而然我們加載的類肯定是我們一項重要的gc root,這樣SystemDictionary就成為了gc過程中的被掃描對象了。

我們的class信息是被分配在哪里的呢?在java7的話是在永久代,在java8就來到了元數(shù)據(jù)空間也就是我們的堆上,所以我們的young gc的時候是不會回收我們的class信息的,那么我們怎么解決這個問題呢?

  • java7: 在G1垃圾收集器中,只有在進(jìn)行full GC的時候,永久代才會被回收,這一過程是stop-the-world的。當(dāng)不做Full GC的時候,G1運行是最優(yōu)化的。只有當(dāng)永久代滿了或者應(yīng)用分配內(nèi)存的速度超過了G1回收垃圾的速度的時候,G1才會觸發(fā)Full GC。在CMS垃圾收集器中,我們可以使用-XX:+CMSClassUnloadingEnabled在CMS concurrent cycle中回收集永久代。在G1里面沒有對應(yīng)的設(shè)置。G1只有在stop-the-world的Full GC的時候,才會回收永久代。我們可以根據(jù)應(yīng)用的需要,設(shè)置PermSize和MaxPermSize參數(shù)來調(diào)優(yōu)永久代的大小。
  • java8:提供了四個參數(shù)-XX:MetaspaceSize,-XX:MaxMetaspaceSize,-XX:MinMetaspaceFreeRatio,-XX:MaxMetaspaceFreeRatio用來控制元空間的大小,當(dāng)超過比例或者大小的時候就會進(jìn)行收集。

但是我們這個問題不應(yīng)該通過垃圾收集去解決,而是應(yīng)該從根源上去解決,那就是不能使用默認(rèn)的XStream構(gòu)造函數(shù),而是需要使用固定ClassLoader的構(gòu)造函數(shù)。

經(jīng)過修改之后上線,經(jīng)過觀察,沒有出現(xiàn)慢GC的現(xiàn)象。

最后

經(jīng)過這次排查的經(jīng)驗來看,遇到GC問題尤其是那種比較不常見的,真的是非常難搞,你可能需要對這個問題進(jìn)行系統(tǒng)的學(xué)習(xí),以及大量的查找資料才能找到原因,我在排查這個問題的時候掉了不少頭發(fā)。在這里記錄一下這個經(jīng)驗,希望對大家以后的一些排查能有幫助。

 

責(zé)任編輯:武曉燕 來源: 咖啡拿鐵
相關(guān)推薦

2023-04-06 07:53:56

Redis連接問題K8s

2021-11-23 21:21:07

線上排查服務(wù)

2021-03-29 12:35:04

Kubernetes環(huán)境TCP

2019-03-15 16:20:45

MySQL死鎖排查命令

2023-01-04 18:32:31

線上服務(wù)代碼

2022-02-08 17:17:27

內(nèi)存泄漏排查

2017-12-19 14:00:16

數(shù)據(jù)庫MySQL死鎖排查

2024-04-10 08:48:31

MySQLSQL語句

2021-04-13 08:54:28

dubbo線程池事故排查

2022-12-17 19:49:37

GCJVM故障

2022-11-16 08:00:00

雪花算法原理

2022-11-03 16:10:29

groovyfullGC

2009-03-20 10:58:47

2024-03-11 08:51:08

JVMSWAP內(nèi)存

2019-09-10 10:31:10

JVM排查解決

2020-11-16 07:19:17

線上函數(shù)性能

2023-10-11 22:24:00

DubboRedis服務(wù)器

2011-01-27 09:19:14

Mono開發(fā)

2021-05-31 10:08:44

工具腳本主機

2023-01-05 11:44:43

性能HTTPS
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: aaa在线观看 | 欧美激情一区二区三区 | 国产日韩精品视频 | 91精品国产综合久久婷婷香蕉 | 91看片视频 | 黄网站免费入口 | 国产精品久久久久久久岛一牛影视 | 一级a毛片 | 一级片在线视频 | 欧美日产国产成人免费图片 | 欧美一级久久 | 久久久国产一区二区三区 | 九九热最新地址 | 九九国产| 久久国产婷婷国产香蕉 | 亚洲精品片 | 黄色免费在线观看网站 | 久久久久久高潮国产精品视 | 亚洲一二三视频 | 亚洲第一在线 | 亚洲成av人影片在线观看 | 91大神在线看 | 亚洲一区二区网站 | 欧美一区免费 | se婷婷| 欧美黑人一区二区三区 | 日韩在线视频一区二区三区 | 国产精品成av人在线视午夜片 | 91丨九色丨国产在线 | 亚洲欧美精品国产一级在线 | 欧美一区视频在线 | 亚洲成a人片| 国产伊人精品 | 亚洲一区二区免费 | 亚洲精品一区中文字幕乱码 | 国产精品99久久久久久动医院 | 毛片com | 综合九九| 亚洲超碰在线观看 | 久久免费视频网 | 日韩视频区 |