Redis 中大 Key 與熱 Key 的解決方案
在工作中Redis已經成為必備的一款高性能的緩存數據庫,但是在實際的使用過程中,我們常常會遇到兩個常見的問題,也就是文章標題所說的大 key與熱 key。
一、定義
1.什么是大key
大 key 指的是一個鍵中包含了大量的數據。(總結一個字就是大)
- 占用空間:大key 通常指的是一個鍵包含了大量的數據,使得該鍵對應值的占用的內存超出了正常范圍。這個大小的閾值并不是固定的,而是相對于 Redis 實例的可用內存而言。當一個鍵的大小超出了 Redis 實例可用內存時,就可以認為它是一個大key。
- 操作耗時:如果對一個 key 的操作所需的時間過長,導致性能下降或者影響其他請求的處理速度,也可以說這個 key 是 大key 。因為這種情況通常是由于該 key 下包含了大量的數據。
2.什么是熱key
熱 key 指的是頻繁訪問的鍵。(總結就是熱,訪問頻繁。)
- 頻繁訪問:在某一段時間內被頻繁訪問的 key 就是 熱key 。
- 業務方面:比如商城促銷的場景下,某個商品的緩存可能就會成為 熱key。這種情況下 熱key 反應的不僅是該鍵的訪問頻率高,還反映了用戶對某個業務功能的熱度。
- 性能方面:熱key 的頻繁訪問造成 Redis 的 CPU 占用率過高,造成響應時間延長或者請求阻塞,從而造成系統崩潰。
key 的大與不大,熱與不熱要根據自己的業務,從實際情況進行評估。
二、影響
1.大 key 的影響
- 內存消耗:在進行緩存時降低緩存的效率,占用大量的內存空間,使得 Redis 的內存消耗急劇增加,還可能導致 Redis 實例的內存資源不足,甚至出發內存淘汰策略,從而影響系統的正常運行。
- 性能下降:處理大的 key,會耗費更多的 CPU 時間以及帶寬,導致 Redis 性能下降。由于 Redis 還是單線程的,處理 大key 的操作進而會阻塞其他請求的處理,從而影響系統性能。
- 持久化效率降低:在進行持久化操作時,AOF與RDB都會因為該 大key 耗費更多的時間,從而延遲持久化時間,分布式環境下甚至會造成緩存不一致。
- 網絡傳輸延遲:大key 在進行網絡傳輸時會增加網絡傳輸的延遲,在分布式環境下進行數據同步時可能會造成數據的不一致。
2.熱 key 的影響
- CPU占用率高:因為是 熱key,所以 CPU 一直占用,進而導致Redis實例的CPU負載增加。
- 請求阻塞:如果 key 有訪問優先級,熱key 的存在可能導致請求隊列中其他的請求被阻塞。
- 響應時間延長:因為 熱key ,其他的請求被阻塞了造成響應時間延長。
- 性能不均衡:流量訪問造成突刺,系統性能的不均衡。
3.小結
大key 與 熱key 都會給 Redis 實例造成一系列的影響,如內存占用過高,CPU 負載增加,持久化時間變長,性能下降等。
三、原因分析
1.大 key 產生的原因
產生 大key 的原因有很多種,下面咱就一起看一下工作中經常遇到的這幾種。
(1) 存儲大量數據
存儲了大量數據也是我們經常遇到 大key 的最多的原因了。
比如 String 類型直接保存了一個大的文本或者二進制數據;Hash 結構中存儲大量的鍵值對。
- String
SET zuiyu_large_text_key "very large text content..."
- Hash
HMSET zuiyu_large_hash_key field1 value1 field2 value2 ... fieldN valueN
(2) 緩存時間設置不合理
緩存時間設置不合理這個造成 大key 的原因大概是個隱藏挺深的老 bug,有的業務場景,使用 Redis 緩存數據,業務是定時往該 key 上寫數據,由于該 key 是沒有設置緩存時間的造成這個 key 隨著時間的流逝,占用的內存越來越多,對于該點,只需要設置一個合理的過期時間即可。
前提是多次寫入不是覆蓋,而是追加才會有該問題。
SETEX zuiyu_key_with_expiry value 3600 # 設置過期時間為3600秒
(3) 數據結構使用不當
在使用 List 數據結構存儲數據時,重復的添加數據,造成該 key 越來越大,實際上業務是不需要有重復的數據存在的。
List
LPUSH zuiyu_large_list_key value
(4) 小結
大key 的產生根本原因就是在一個 key 下面存儲的數據多了。
2.熱 key 產生的原因
(1) 熱門數據
熱key 的產生一般意味著系統訪問火爆了,但是火爆的只是其中一個點或者n個點。類似微博中某個明星的瓜,當上頭條的時候,大量的人去訪問,造成了該明星所對應的 key 成為 熱key。
(2) 頻繁的更新
某些業務場景,單位時間內一直頻繁的對 key 進行更新,該 key 也會成為 熱key。
(3) 熱門搜索
類似于第一中的熱門數據,產生了熱門數據,該數據對應的熱門關鍵詞也被大量的用戶去搜索,造成該關鍵詞被頻繁訪問,最終導致該 key 也稱為 熱key。
(4) 小結
熱key 的產生無外乎熱門數據,熱門數據產生的熱門關鍵詞以及對同一個 key 在某段時間內的頻繁訪問。
四、解決方案
1.大key的解決方案
- 合理的數據結構
- 合理的緩存時間
- 大key 進行拆分為多個 小key
- 定期對 大key 進行清理
2.熱key的解決方案
- 合理的緩存淘汰策略
- 熱點數據分片:將熱點數據分散到不同的Redis實例,提升系統的吞吐量。
- 緩存預熱:在系統啟動或者活動高峰開啟之前進行緩存預熱,提前將需要的數據加載到緩存,減少熱點數據首次訪問的時間。
- 隨機緩存失效時間:避免大量的key同一時間批量失效,造成緩存雪崩與緩存穿透。
- 緩存穿透:使用布隆過濾器進行緩存請求過濾,防止無效請求進入到緩存層。
五、總結
針對 大key 我們要盡可能的避免同一個 key 下大量的數據。針對 熱key 我們要合理設置過期時間,增加布隆過濾器等技術實現無效請求過濾,對即將到來的數據進行緩存預熱、熱點數據分片處理。