這么多人裝X的人聊區塊鏈,區塊鏈究竟是個什么系統?
很多人聊區塊鏈,但其實搞不清楚它究竟是啥,從技術的角度,從架構的角度,說說區塊鏈是個什么系統。
畫外音:可忽略AI起的標題。
究竟啥是區塊鏈?
一句話,區塊鏈是一個存儲系統。一個沒有管理員,每個節點都擁有全部數據的分布式存儲系統。
通常所見的存儲系統是啥樣的?
如上圖,一塊空間存儲數據,一個軟件管理數據,提供接口寫入數據,這是存儲系統,例如mysql。
普通的存儲系統會有什么常見的問題?
常見的有兩個問題:
- 數據存在一個地方很危險,空間損壞數據就丟了,用技術的話說即“數據不高可用”;
- 寫入點只有一個,用技術的話說即“單點控制”;
如何保證數據高可用?
解決高可用要“冗余”,如上圖,如果能把數據冗余到多個地方,就能保證高可用,一個地方的數據掛了,另外的地方仍存有數據。例如mysql主從集群,以及磁盤的RAID都是這個原理。
這里需要強調兩點:
- 數據冗余往往會引發一致性問題,例如mysql主從集群中的讀寫延時問題;
- 數據冗余往往會降低寫入效率,因為同步數據需要消耗額外的資源;
可不可以多點寫入?
可以??梢远鄠€節點都實施寫入,例如mysql雙主集群,又或者多機房多活數據中心。這里要強調的是,多節點寫入往往會引發寫寫沖突的一致性問題。
多點控制寫入之后,其實出現了多中心控制,在數據不一致的時候,往往需要有一個算法來協商如何處理不一致數據。
- 例如,存在兩個中心節點時,可以約定這樣的算法來處理不一致:以時間戳最小的數據為準,即先來先得。
- 又例如,存在多個中心節點時,可以約定這樣的算法來處理不一致:投票,以多數票的數據為準。
什么是區塊鏈?
有了上面的鋪墊,區塊鏈就不難理解了。
- 區塊是一塊存儲空間,可以存儲數據;
- 區塊鏈不但像鏈表一樣把區塊串起來,還有約定了一系列的方法管理這些數據,所以它是存儲系統;
- 區塊鏈有很多節點,每個節點都保存了全部的數據,所以它是高可用的;
- 每一個中心節點都可以生成區塊,并寫入數據,所以每一個點都是中心節點,或者說區塊鏈是去中心化的,要想控制整個系統,必須控制一半以上的節點,才能控制投票,于是這個系統沒有管理員;
綜上,區塊鏈實際上是一個沒有管理員的,去中心化的,每個節點都擁有全部數據的分布式存儲系統。只要你愿意,你隨時可以成為區塊鏈中的一個節點,并參與區塊的生成與寫入,比特幣就是基于這個分布式存儲上的電子貨幣。
由于節點很多,很多數據需要同步,這個系統的存儲容量其實不大,全球存儲比特幣的區塊鏈也就幾百G數據。
畫外音:互聯網存儲系統,存儲量遠超這個值。
因為節點很多,數據需要保持一致,這個系統的寫入效率也很低,存儲比特幣的區塊鏈每10分鐘才生成1個區塊,1個區塊只有1M的存儲空間,只夠寫入2000筆比特幣交易的數據。
存儲比特幣的區塊鏈,每日約處理30W筆交易,也就是說,系統的TPS只有個位數,這個存儲系統的效率非常低。
畫外音:互聯網交易系統,吞吐量動輒成千上萬。
關于區塊鏈,本文只說了概念,很多細節未涉及,如果大家感興趣,未來再聊。
知其然,知其所以然。
思路比結論更重要。