HashMap的負(fù)載因子初始值為什么是0.75?這篇文章告訴你答案
之前寫(xiě)過(guò)一篇專(zhuān)門(mén)介紹HashMap的文章,反響很不錯(cuò),不過(guò)在留言區(qū)問(wèn)的最多的問(wèn)題就是HashMap的負(fù)載因子初始值為什么是0.75,私下又好好地研究了一番,總結(jié)了這篇文章。
本篇文章基于JDK1.8,特在此說(shuō)明。
OK。下面我們就開(kāi)始進(jìn)行分析。
一、負(fù)載因子的作用
對(duì)于HashMap的研究,我之前一直停留在考慮源碼是如何實(shí)現(xiàn)的,現(xiàn)在當(dāng)我重新再來(lái)看的時(shí)候,才發(fā)現(xiàn),系統(tǒng)默認(rèn)的各種參數(shù)值,才是HashMap的精華所在。
負(fù)載因子是和擴(kuò)容機(jī)制有關(guān)的,意思是如果當(dāng)前容器的容量,達(dá)到了我們?cè)O(shè)定的最大值,就要開(kāi)始執(zhí)行擴(kuò)容操作。舉個(gè)例子來(lái)解釋?zhuān)苊庑“茁?tīng)不懂:
比如說(shuō)當(dāng)前的容器容量是16,負(fù)載因子是0.75,16*0.75=12,也就是說(shuō),當(dāng)容量達(dá)到了12的時(shí)候就會(huì)進(jìn)行擴(kuò)容操作。
他的作用很簡(jiǎn)單,相當(dāng)于是一個(gè)擴(kuò)容機(jī)制的閾值。當(dāng)超過(guò)了這個(gè)閾值,就會(huì)觸發(fā)擴(kuò)容機(jī)制。HashMap源碼已經(jīng)為我們默認(rèn)指定了負(fù)載因子是0.75。

我截取了部分源碼,從這里可以看出,系統(tǒng)默認(rèn)的負(fù)載因子值就是0.75,而且我們還可以在構(gòu)造方法中去指定。下面我們就正式來(lái)分析一下為什么是默認(rèn)的0.75。
二、原因解釋?zhuān)ㄖ攸c(diǎn))
我們?cè)诳紤]HashMap的時(shí)候,首先要想到的是HashMap只是一個(gè)數(shù)據(jù)結(jié)構(gòu),既然是數(shù)據(jù)結(jié)構(gòu)最主要的就是節(jié)省時(shí)間和空間。負(fù)載因子的作用肯定也是節(jié)省時(shí)間和空間。為什么節(jié)省呢?我們考慮兩種極端情況。
1、負(fù)載因子是1.0
我們先看HashMap的底層數(shù)據(jù)結(jié)構(gòu)

我們的數(shù)據(jù)一開(kāi)始是保存在數(shù)組里面的,當(dāng)發(fā)生了Hash碰撞的時(shí)候,就是在這個(gè)數(shù)據(jù)節(jié)點(diǎn)上,生出一個(gè)鏈表,當(dāng)鏈表長(zhǎng)度達(dá)到一定長(zhǎng)度的時(shí)候,就會(huì)把鏈表轉(zhuǎn)化為紅黑樹(shù)。
當(dāng)負(fù)載因子是1.0的時(shí)候,也就意味著,只有當(dāng)數(shù)組的8個(gè)值(這個(gè)圖表示了8個(gè))全部填充了,才會(huì)發(fā)生擴(kuò)容。這就帶來(lái)了很大的問(wèn)題,因?yàn)镠ash沖突時(shí)避免不了的。當(dāng)負(fù)載因子是1.0的時(shí)候,意味著會(huì)出現(xiàn)大量的Hash的沖突,底層的紅黑樹(shù)變得異常復(fù)雜。對(duì)于查詢(xún)效率極其不利。這種情況就是犧牲了時(shí)間來(lái)保證空間的利用率。
因此一句話(huà)總結(jié)就是負(fù)載因子過(guò)大,雖然空間利用率上去了,但是時(shí)間效率降低了。
2、負(fù)載因子是0.5
負(fù)載因子是0.5的時(shí)候,這也就意味著,當(dāng)數(shù)組中的元素達(dá)到了一半就開(kāi)始擴(kuò)容,既然填充的元素少了,Hash沖突也會(huì)減少,那么底層的鏈表長(zhǎng)度或者是紅黑樹(shù)的高度就會(huì)降低。查詢(xún)效率就會(huì)增加。
但是,兄弟們,這時(shí)候空間利用率就會(huì)大大的降低,原本存儲(chǔ)1M的數(shù)據(jù),現(xiàn)在就意味著需要2M的空間。
一句話(huà)總結(jié)就是負(fù)載因子太小,雖然時(shí)間效率提升了,但是空間利用率降低了。
3、負(fù)載因子0.75
經(jīng)過(guò)前面的分析,基本上為什么是0.75的答案也就出來(lái)了,這是時(shí)間和空間的權(quán)衡。當(dāng)然這個(gè)答案不是我自己想出來(lái)的。答案就在源碼上,我們可以看看:

大致意思就是說(shuō)負(fù)載因子是0.75的時(shí)候,空間利用率比較高,而且避免了相當(dāng)多的Hash沖突,使得底層的鏈表或者是紅黑樹(shù)的高度比較低,提升了空間效率。
OK,寫(xiě)到這答案基本上就出來(lái)了,一句話(huà)能總結(jié)的寫(xiě)成了一篇文章。如有問(wèn)題,還請(qǐng)批評(píng)指正。