成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

HashMap 的 Hash 方法原理是什么?

開發 前端
hash 方法是用來做哈希值優化的,把哈希值右移 16 位,也就正好是自己長度的一半,之后與原哈希值做異或運算,這樣就混合了原哈希值中的高位和低位,增大了隨機性。

[[423110]]

本文 GitHub 上已同步,有 GitHub 賬號的小伙伴,記得看完后給二哥安排一波 star 呀!沖一波 GitHub 的 trending 榜單,求求各位了。

GitHub 地址:https://github.com/itwanger/toBeBetterJavaer

在線閱讀地址:https://itwanger.gitee.io/tobebetterjavaer

來看一下 hash 方法的源碼(JDK 8 中的 HashMap):

  1. static final int hash(Object key) { 
  2.     int h; 
  3.     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 

這段代碼究竟是用來干嘛的呢?

我們都知道,key.hashCode() 是用來獲取鍵位的哈希值的,理論上,哈希值是一個 int 類型,范圍從-2147483648 到 2147483648。前后加起來大概 40 億的映射空間,只要哈希值映射得比較均勻松散,一般是不會出現哈希碰撞的。

但問題是一個 40 億長度的數組,內存是放不下的。HashMap 擴容之前的數組初始大小只有 16,所以這個哈希值是不能直接拿來用的,用之前要和數組的長度做取模運算,用得到的余數來訪問數組下標才行。

取模運算有兩處。

取模運算(“Modulo Operation”)和取余運算(“Remainder Operation ”)兩個概念有重疊的部分但又不完全一致。主要的區別在于對負整數進行除法運算時操作不同。取模主要是用于計算機術語中,取余則更多是數學概念。

一處是往 HashMap 中 put 的時候(putVal 方法中):

  1. final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { 
  2.      HashMap.Node<K,V>[] tab; HashMap.Node<K,V> p; int n, i; 
  3.      if ((tab = table) == null || (n = tab.length) == 0) 
  4.          n = (tab = resize()).length; 
  5.      if ((p = tab[i = (n - 1) & hash]) == null
  6.          tab[i] = newNode(hash, key, value, null); 

一處是從 HashMap 中 get 的時候(getNode 方法中):

  1. final Node<K,V> getNode(int hash, Object key) { 
  2.      Node<K,V>[] tab; Node<K,V> first, e; int n; K k; 
  3.      if ((tab = table) != null && (n = tab.length) > 0 && 
  4.             (first = tab[(n - 1) & hash]) != null) {} 

其中的 (n - 1) & hash 正是取模運算,就是把哈希值和(數組長度-1)做了一個“與”運算。

可能大家在疑惑:取模運算難道不該用 % 嗎?為什么要用 & 呢?

這是因為 & 運算比 % 更加高效,并且當 b 為 2 的 n 次方時,存在下面這樣一個公式。

  1. a % b = a & (b-1) 

用 替換下 b 就是:

我們來驗證一下,假如 a = 14,b = 8,也就是 ,n=3。

這也正好解釋了為什么 HashMap 的數組長度要取 2 的整次方。

因為(數組長度-1)正好相當于一個“低位掩碼”——這個掩碼的低位最好全是 1,這樣 & 操作才有意義,否則結果就肯定是 0,那么 & 操作就沒有意義了。

a&b 操作的結果是:a、b 中對應位同時為 1,則對應結果位為 1,否則為 0

2 的整次冪剛好是偶數,偶數-1 是奇數,奇數的二進制最后一位是 1,保證了 hash &(length-1) 的最后一位可能為 0,也可能為 1(這取決于 h 的值),即 & 運算后的結果可能為偶數,也可能為奇數,這樣便可以保證哈希值的均勻性。

& 操作的結果就是將哈希值的高位全部歸零,只保留低位值,用來做數組下標訪問。

假設某哈希值為 10100101 11000100 00100101,用它來做取模運算,我們來看一下結果。HashMap 的初始長度為 16(內部是數組),16-1=15,二進制是 00000000 00000000 00001111(高位用 0 來補齊):

  1.   10100101 11000100 00100101 
  2. & 00000000 00000000 00001111 
  3. ---------------------------------- 
  4.   00000000 00000000 00000101 

因為 15 的高位全部是 0,所以 & 運算后的高位結果肯定是 0,只剩下 4 個低位 0101,也就是十進制的 5,也就是將哈希值為 10100101 11000100 00100101 的鍵放在數組的第 5 位。

明白了取模運算后,我們再來看 put 方法的源碼:

  1. public V put(K key, V value) { 
  2.     return putVal(hash(key), key, value, falsetrue); 

以及 get 方法的源碼:

  1. public V get(Object key) { 
  2.     HashMap.Node<K,V> e; 
  3.     return (e = getNode(hash(key), key)) == null ? null : e.value; 

它們在調用 putVal 和 getNode 之前,都會先調用 hash 方法:

  1. static final int hash(Object key) { 
  2.     int h; 
  3.     return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); 

那為什么取模運算之前要調用 hash 方法呢?

看下面這個圖。

某哈希值為 11111111 11111111 11110000 1110 1010,將它右移 16 位(h >>> 16),剛好是 00000000 00000000 11111111 11111111,再進行異或操作(h ^ (h >>> 16)),結果是 11111111 11111111 00001111 00010101

異或(^)運算是基于二進制的位運算,采用符號 XOR 或者^來表示,運算規則是:如果是同值取 0、異值取 1

由于混合了原來哈希值的高位和低位,所以低位的隨機性加大了(摻雜了部分高位的特征,高位的信息也得到了保留)。

結果再與數組長度-1(00000000 00000000 00000000 00001111)做取模運算,得到的下標就是 00000000 00000000 00000000 00000101,也就是 5。

還記得之前我們假設的某哈希值 10100101 11000100 00100101 嗎?在沒有調用 hash 方法之前,與 15 做取模運算后的結果也是 5,我們不妨來看看調用 hash 之后的取模運算結果是多少。

某哈希值 00000000 10100101 11000100 00100101(補齊 32 位),將它右移 16 位(h >>> 16),剛好是 00000000 00000000 00000000 10100101,再進行異或操作(h ^ (h >>> 16)),結果是 00000000 10100101 00111011 10000000

結果再與數組長度-1(00000000 00000000 00000000 00001111)做取模運算,得到的下標就是 00000000 00000000 00000000 00000000,也就是 0。

綜上所述,hash 方法是用來做哈希值優化的,把哈希值右移 16 位,也就正好是自己長度的一半,之后與原哈希值做異或運算,這樣就混合了原哈希值中的高位和低位,增大了隨機性。

說白了,hash 方法就是為了增加隨機性,讓數據元素更加均衡的分布,減少碰撞。

參考鏈接:

 

https://blog.csdn.net/lonyw/article/details/80519652 >https://zhuanlan.zhihu.com/p/91636401 >https://www.zhihu.com/question/20733617

 

責任編輯:武曉燕 來源: 沉默王二
相關推薦

2023-02-13 08:01:49

HashHashMapint

2025-01-15 13:30:48

FeignHTTPJava

2023-11-05 10:52:54

DNS服務器瀏覽器

2024-11-25 12:20:00

Hystrix微服務架構

2021-04-26 07:51:00

JavaScript方法函數

2016-09-12 14:33:20

javaHashMap

2023-07-11 08:00:00

2012-03-15 16:27:13

JavaHashMap

2023-01-04 07:54:03

HashMap底層JDK

2021-09-27 08:02:17

CDN加速網站網絡

2021-05-09 09:30:13

Docker操作系統容器

2021-07-29 11:46:27

NAS存儲NAS服務器

2013-06-06 13:10:44

HashMap無鎖

2023-10-18 10:55:55

HashMap

2018-02-23 14:13:39

前端Cookie用戶登錄

2022-02-25 14:11:48

短網址Java算法

2024-12-24 14:11:57

2017-07-13 10:43:52

CNNmaxpool池化

2024-06-06 08:53:13

動態鏈接庫共享庫

2020-03-23 10:09:27

云安全云計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品国产久精国产 | www.9191.com| 亚州精品天堂中文字幕 | 久草新在线 | 欧美综合视频 | 黄网站在线观看 | h片在线免费观看 | 精品一区二区三区四区在线 | 国产午夜精品久久久久免费视高清 | 免费看国产精品视频 | 狠狠影院 | 毛片免费看 | 黄免费观看 | 野狼在线社区2017入口 | 日韩在线免费 | 国产成人精品一区二区三区在线 | 国产目拍亚洲精品99久久精品 | 久久精品播放 | 一区二区三区免费在线观看 | 日韩在线一区二区三区 | 国产亚洲精品久久久久久豆腐 | 希岛爱理在线 | 欧美激情一区二区三区 | 日韩在线中文 | 色综合天天综合网国产成人网 | 久久久国产精品网站 | 精品久久影院 | 国产精品久久久久久亚洲调教 | 99精品免费视频 | 伊人春色在线 | 国产二区三区 | 欧美寡妇偷汉性猛交 | 国产精品国产a级 | 国产黄色在线观看 | 欧美成人免费 | 国产999精品久久久久久 | 伊人激情网 | 巨大黑人极品videos精品 | 天天躁日日躁狠狠躁白人 | 呦呦在线视频 | 国产精品欧美一区二区三区 |