Redis延時隊列,這次徹底給你整明白了
所謂延時隊列就是延時的消息隊列,下面說一下一些業務場景
實踐場景
訂單支付失敗,每隔一段時間提醒用戶
用戶并發量的情況,可以延時2分鐘給用戶發短信
先來看看Redis實現普通的消息隊列
我們知道,對于專業的消息隊列中間件,如Kafka和RabbitMQ,消費者在消費消息之前要進行一系列的繁瑣過程。
如RabbitMQ發消息之前要創建 Exchange,再創建 Queue,還要將 Queue 和 Exchange 通過某種規則綁定起來,發消息的時候要指定 routingkey,還要控制頭部信息
但是絕大 多數情況下,雖然我們的消息隊列只有一組消費者,但還是需要經歷上面一些過程。
有了 Redis,對于那些只有一組消費者的消息隊列,使用 Redis 就可以非常輕松的搞定。Redis 的消息隊列不是專業的消息隊列,它沒有非常多的高級特性, 沒有 ack 保證,如果對消息的可靠性有著極致的追求,那么它就不適合使用
異步消息隊列基本實現
Redis 的 list(列表) 數據結構常用來作為異步消息隊列使用,使用 rpush/lpush 操作入隊列, 使用 lpop 和 rpop 來出隊列
- > rpush queue 月伴飛魚1 月伴飛魚2 月伴飛魚3
- (integer) 3
- > lpop queue
- "月伴飛魚1"
- > llen queue
- (integer) 2
問題1:如果隊列空了
客戶端是通過隊列的 pop 操作來獲取消息,然后進行處理。處理完了再接著獲取消息, 再進行處理。如此循環往復,這便是作為隊列消費者的客戶端的生命周期。
可是如果隊列空了,客戶端就會陷入 pop 的死循環,不停地 pop,沒有數據,接著再 pop, 又沒有數據。這就是浪費生命的空輪詢??蛰喸儾坏吡丝蛻舳说?CPU,redis 的 QPS 也 會被拉高,如果這樣空輪詢的客戶端有幾十來個,Redis 的慢查詢可能會顯著增多。
通常我們使用 sleep 來解決這個問題,讓線程睡一會,睡個 1s 鐘就可以了。不但客戶端 的 CPU 能降下來,Redis 的 QPS 也降下來了
問題2:隊列延遲
用上面睡眠的辦法可以解決問題。同時如果只有 1 個消費者,那么這個延遲就是 1s。如果有多個消費者,這個延遲會有所下降,因 為每個消費者的睡覺時間是岔開來的。
有沒有什么辦法能顯著降低延遲呢?
那就是 blpop/brpop。
這兩個指令的前綴字符 b 代表的是 blocking,也就是阻塞讀。
阻塞讀在隊列沒有數據的時候,會立即進入休眠狀態,一旦數據到來,則立刻醒過來。消 息的延遲幾乎為零。用 blpop/brpop 替代前面的 lpop/rpop,就完美解決了上面的問題。
問題3:空閑連接自動斷開
其實他還有個問題需要解決—— 空閑連接的問題。
如果線程一直阻塞在哪里,Redis 的客戶端連接就成了閑置連接,閑置過久,服務器一般 會主動斷開連接,減少閑置資源占用。這個時候 blpop/brpop 會拋出異常來。
所以編寫客戶端消費者的時候要小心,注意捕獲異常,還要重試。
分布式鎖沖突處理
假如客戶端在處理請求時加分布式鎖沒加成功怎么辦。
一般有 3 種策略來處理加鎖失?。?/strong>
1、直接拋出異常,通知用戶稍后重試;
2、sleep 一會再重試;
3、將請求轉移至延時隊列,過一會再試;
直接拋出特定類型的異常
這種方式比較適合由用戶直接發起的請求,用戶看到錯誤對話框后,會先閱讀對話框的內 容,再點擊重試,這樣就可以起到人工延時的效果。如果考慮到用戶體驗,可以由前端的代碼 替代用戶自己來進行延時重試控制。它本質上是對當前請求的放棄,由用戶決定是否重新發起 新的請求。
sleep
sleep 會阻塞當前的消息處理線程,會導致隊列的后續消息處理出現延遲。如果碰撞的比 較頻繁或者隊列里消息比較多,sleep 可能并不合適。如果因為個別死鎖的 key 導致加鎖不成 功,線程會徹底堵死,導致后續消息永遠得不到及時處理。
延時隊列
這種方式比較適合異步消息處理,將當前沖突的請求扔到另一個隊列延后處理以避開沖突。
延時隊列的實現
我們可以使用 zset這個命令,用設置好的時間戳作為score進行排序,使用 zadd score1 value1 ....命令就可以一直往內存中生產消息。再利用 zrangebysocre 查詢符合條件的所有待處理的任務,通過循環執行隊列任務即可。也可以通過 zrangebyscore key min max withscores limit 0 1 查詢最早的一條任務,來進行消費
- private Jedis jedis;
- public void redisDelayQueueTest() {
- String key = "delay_queue";
- // 實際開發建議使用業務 ID 和隨機生成的唯一 ID 作為 value, 隨機生成的唯一 ID 可以保證消息的唯一性, 業務 ID 可以避免 value 攜帶的信息過多
- String orderId1 = UUID.randomUUID().toString();
- jedis.zadd(queueKey, System.currentTimeMillis() + 5000, orderId1);
- String orderId12 = UUID.randomUUID().toString();
- jedis.zadd(queueKey, System.currentTimeMillis() + 5000, orderId2);
- new Thread() {
- @Override
- public void run() {
- while (true) {
- Set<String> resultList;
- // 只獲取第一條數據, 只獲取不會移除數據
- resultList = jedis.zrangebyscore(key, System.currentTimeMillis(), 0, 1);
- if (resultList.size() == 0) {
- try {
- Thread.sleep(1000);
- } catch (InterruptedException e) {
- e.printStackTrace();
- break;
- }
- } else {
- // 移除數據獲取到的數據
- if (jedis.zrem(key, resultList.get(0)) > 0) {
- String orderId = resultList.get(0);
- log.info("orderId = {}", resultList.get(0));
- this.handleMsg(orderId);
- }
- }
- }
- }
- }.start();
- }
- public void handleMsg(T msg) {
- System.out.println(msg);
- }
上面的實現, 在多線程邏輯上也是沒有問題的, 假設有兩個線程 T1, T2和其他更多線程, 處理邏輯如下, 保證了多線程情況下只有一個線程處理了對應的消息:
1.T1, T2 和其他更多線程調用 zrangebyscore 獲取到了一條消息 A
2.T1 準備開始刪除消息 A, 由于是原子操作, T2 和其他更多線程等待 T1 執行 zrem 刪除消息 A 后再執行 zrem 刪除消息 A
3.T1 刪除了消息 A, 返回刪除成功標記 1, 并對消息 A 進行處理
4.T2 其他更多線程開始 zrem 刪除消息 A, 由于消息 A 已經被刪除, 所以所有的刪除均失敗, 放棄了對消息 A 的處理
同時,我們要注意一定要對 handle_msg 進行異常捕獲,避免因為個別任務處理問題導致循環異常退 出
進一步優化
上面的算法中同一個任務可能會被多個進程取到之后再使用 zrem 進行爭搶,那些沒搶到 的進程都是白取了一次任務,這是浪費。可以考慮使用 lua scripting 來優化一下這個邏輯,將 zrangebyscore 和 zrem 一同挪到服務器端進行原子化操作,這樣多個進程之間爭搶任務時就不 會出現這種浪費了
使用調用Lua腳本進一步優化
Lua 腳本, 如果有超時的消息, 就刪除, 并返回這條消息, 否則返回空字符串:
- String luaScript = "local resultArray = redis.call('zrangebyscore', KEYS[1], 0, ARGV[1], 'limit' , 0, 1)\n" +
- "if #resultArray > 0 then\n" +
- " if redis.call('zrem', KEYS[1], resultArray[1]) > 0 then\n" +
- " return resultArray[1]\n" +
- " else\n" +
- " return ''\n" +
- " end\n" +
- "else\n" +
- " return ''\n" +
- "end";
- jedis.eval(luaScript, ScriptOutputType.VALUE, new String[]{key}, String.valueOf(System.currentTimeMillis()));
Redis延時隊列優勢
Redis用來進行實現延時隊列是具有這些優勢的:
1.Redis zset支持高性能的 score 排序。
2.Redis是在內存上進行操作的,速度非??臁?/p>
3.Redis可以搭建集群,當消息很多時候,我們可以用集群來提高消息處理的速度,提高可用性。
4.Redis具有持久化機制,當出現故障的時候,可以通過AOF和RDB方式來對數據進行恢復,保證了數據的可靠性
Redis延時隊列劣勢
使用 Redis 實現的延時消息隊列也存在數據持久化, 消息可靠性的問題
沒有重試機制 - 處理消息出現異常沒有重試機制, 這些需要自己去實現, 包括重試次數的實現等
沒有 ACK 機制 - 例如在獲取消息并已經刪除了消息情況下, 正在處理消息的時候客戶端崩潰了, 這條正在處理的這些消息就會丟失, MQ 是需要明確的返回一個值給 MQ 才會認為這個消息是被正確的消費了
如果對消息可靠性要求較高, 推薦使用 MQ 來實現
Redission實現延時隊列
基于Redis的Redisson分布式延遲隊列結構的RDelayedQueue Java對象在實現了RQueue接口的基礎上提供了向隊列按要求延遲添加項目的功能。該功能可以用來實現消息傳送延遲按幾何增長或幾何衰減的發送策略
- RQueue<String> distinationQueue = ...
- RDelayedQueue<String> delayedQueue = getDelayedQueue(distinationQueue);
- // 10秒鐘以后將消息發送到指定隊列
- delayedQueue.offer("msg1", 10, TimeUnit.SECONDS);
- // 一分鐘以后將消息發送到指定隊列
- delayedQueue.offer("msg2", 1, TimeUnit.MINUTES);
在該對象不再需要的情況下,應該主動銷毀。僅在相關的Redisson對象也需要關閉的時候可以不用主動銷毀。
- RDelayedQueue<String> delayedQueue = ...
- delayedQueue.destroy();
是不是很方便...............
本文轉載自微信公眾號「月伴飛魚」,可以通過以下二維碼關注。轉載本文請聯系月伴飛魚公眾號。