全球最大的云計算實例:Netflix如何架構IT
在線視頻租賃服務商Netflix每月的視頻訪問超過10億次,是全球***的云計算實例。
近日在舊金山舉行的Linux基金會協作峰會上,Netflix的云系統架構總監Cockcroft透露,Netflix的Linux、FreeBSD和各種基于開源軟件的服務都是純粹的“原生云計算”。
Cockcroft之所以這么說是因為雖然每月的視頻訪問量超過10億次,但Netflix并沒有自己的數據中心,2009年Netflix開始使用亞馬遜的AWS云計算服務,到2012年11月,Netflix把所有IT基礎設施都轉移到了亞馬遜的AWS云端。

具體來說,根據客戶需求,Netflix的前端服務運行在500-1000臺基于Linux的Tomcat JavaServer和NGINX web服務器上,存儲則采用亞馬遜的S3云存儲和NoSQL Cassandra數據庫服務器(采用Memcached高性能分布式內存對象緩存系統)。所有這些服務都通過亞馬遜AWS的三大可用云區發布,確保用戶無論使用移動設備還是瀏覽器都能快速瀏覽視頻。
Cockcroft透露,如果三個亞馬遜云區中的一個出現故障,Netflix依然可以通過其余兩個云區提供完整的服務。Cockcroft表示這并不是照搬亞馬遜的廣告詞,而是通過開源軟件Chaos Gorilla對AWS全局測試的結果。
實現云區間的視頻和服務的備份并不容易,Netflix目前已經有了自己的CDN——Open Connect,并且在本地ISP節點部署了大量服務器。但真正困難的問題在于當一個云區出現故障時,如何讓DNS系統將流量及時指向可用的云區?眾所周知,DNS與API有很大的不同,DNS的設計原理更多依賴工程師手動配置,因此實現自動化的難度很大。目前Netflix內部有一個技術計劃,目標不是如何杜絕云計算宕機,而是對云計算的宕機過程變得更加平緩,而不是像斷電一樣突然之間癱瘓,這可以為后繼手段爭取時間。
需要指出的是,Netflix的云計算架構依然存在風險,例如2012年12月亞馬遜AWS東岸數據中心的負載均衡故障導致圣誕節期間Netflix的服務不可用。
雖然Netflix的云計算架構并不***,但是通過將IT基礎設施全部轉移至云端,Netflix實現了IT架構的高度敏捷性和可用性:新功能代碼能在數天內發布而不是過去的數月,在數分鐘內配置并啟用新的硬件而不是過去的數周,Netflix在公有云上構建了互聯網上占用帶寬最多的媒體發布平臺,并快速成長為能夠顛覆傳統電視行業的互聯網巨頭,這一切,都離不開其云計算架構的成功。
原文鏈接:http://www.ctocio.com/ccnews/12150.html