微信產品經理面試題:朋友圈是如何設置信息圍欄的?
而在權限管理上,微信采用了給用戶打「標簽」來進行分組,這個標簽的分組與微信通訊錄一致。在數據上,就是給每個關系增加一個「標簽」標記。這里需要注意的是,雖然微信的關系在產品使用上給用戶是雙向的(即互相關注),但是在存儲的時候,是給互相關的兩個用戶分別建立了關系數據,也就是每個人獨有自己的一份「通訊錄」。這通過刪除了自己的好友之后,自己并不從別人的通訊錄刪除就可以看得出來。標簽分組的基礎數據就是這樣了,這也是后面朋友圈權限管理的基礎。
對于個人朋友圈 timeline 所能看到的消息,按照一般的邏輯是先獲取所有朋友的消息,然后剔除掉沒有授權給自己看的消息、剔除掉自己屏蔽的用戶消息,然后才得到自己當前看到的 timeline。如果是這樣的邏輯的話,等于每次刷新朋友圈,都要跑到所有的消息池里面去找到上述通訊錄中朋友們的消息,還要對找到的每條消息去判斷用戶是否有權限閱讀。這顯然是效率低下的方式,更何況微信是這么大的一個訪問量和數據量。所以,這種數據結構設計是行不通的了。
一般邏輯下朋友圈每次讀取的過程
利用零散時間進行關系計算
解決這種性能問題一般的思路就是把需要大計算量的過程分散到平時零散的時間去做。在這里的思路就是:平時就把每個用戶需要的 timeline 數據按照權限設置準備好,等到用的時候(刷新朋友圈)就直接讀取準備好的內容。那么答案就出來了:除了存儲一份上面講到的文字,圖片等基本信息外,還需要給每個用戶存儲一份 timeline 數據,注意,是每個用戶一份。當然,這里的「每份」不需要存儲完整信息,只需要存儲消息的 ID 和時間(可能需要)。每個人刷新自己的朋友圈時,讀取自己的那份數據就行了,既不用去消息池子里面篩選,也不用判斷用戶權限。
那是怎么實現權限控制呢?
新消息產生新權限
當一個用戶發布一條消息時會按照上面講的標簽設置相關的權限,服務器就會給每個有權限接收這條消息的用戶的 timeline 中寫入這條消息。也就是在用戶發布的這一刻,就做好了權限安排,而不是等到讀取的時候。這樣就自然減少了讀取的時候的計算量,提高了效率。
發布時進行權限控制(示意圖,實際比這復雜)
至于分庫分表這些就不展開了,知道有這么回事就行。有時候這種技術上的設計也是會限制產品的設計。
那怎么證明上面說的合理呢?
感興趣的同學可以去測試下:先發一條帶閱讀權限的消息,比如允許某個標簽的人看。然后再給這個標簽添加一個新人。結果是這個新人是看不到這條消息的,因為權限劃分是在發布的時候就劃分好了,新人加入標簽的時間是在發布之后,所以沒法獲得這條消息的權限分配機會,雖然他后來在標簽組中,但是仍然沒有辦法看到這條消息。
作為一個微信設計的旁觀者,以上答案是作為一個用戶從系統分析的角度去考慮的,并不代表微信確實是這樣的一個設計思路,但答案中的方案已經盡可能做到了可以驗證。答案中也沒有涉及到具體的技術,僅僅是一個系統分析的思路。