15萬買到64萬? 一臺全閃陣列的生意經
作者:佚名
作為存儲管理員,以前只要守衛技術象牙塔,真是怎么爽由自己!
偶爾被拉進一個什么銷售動員大會,還可以教育臺下一眾“技術小白”,講一講我們存儲的技術原理、管理流程,讓他們明白,所謂的促銷戰役對于我們存儲來說,是極為不靠譜的!
可是現在,連平常甚少逛街的我都發現了,電商還真是“多快好省”啊!但說歸說,那些銷售部門分分鐘搞出來的造節、大促,對于IT部門仍然是“被戰役”!要上線新服務,提供新的存儲卷,做數據分析,真真一個“燙手山芋”啊!
短暫的糾結過后,還得面對現實,畢竟“互聯網+”給各行各業帶來的沖擊是有目共睹的!作為企業的IT管理人員,豈能坐視不理?
該干的活兒還得咱自己想辦法!找個專業人士咨詢則個!
第一個想到的,便是去拜訪主張“加速促進新解決方案落地”的企事錄團隊,聯合創始人曾智強在企業級存儲領域有很多獨到見解,想必能給我一些中肯的建議!
果然,了解我的問題與困惑以后,曾智強迅速把解決方案鎖定為全閃存陣列,“你要的是性能,又不太重容量”,而且,“一臺配6個SSD的全閃才15萬起步,每IOPS才一塊錢!”
后來的溝通證實,這個建議背后源于企事錄團隊剛剛做過的一輪全閃存陣列評測,針對目前企業存儲的挑戰與存儲管理員的困惑,猶如剝筍一般層層分解,最終得來“金句”。
一起來看專業評測如何剝筍吧,有圖有真相!
拓撲圖顯示,整個測試環境采用傳統的SAN架構,最上是戴爾PowerEdge R930四路服務器(72物理核心512GB內存),安裝Oracle Linux 6.6和Oracle 12c,通過兩塊雙端口FC HBA與中間的Brocade 6505 16Gb/s FC交換機相連接,因為是測試環境,交換機只有一臺,并沒有冗余設置。
最下即全閃存陣列,來自戴爾的Storage SC4020,配備了20塊200GB容量的SSD,一塊為熱備盤,19塊盤以一種類似于RAID 10的方式冗余。
據說,戴爾官方售價15萬8千8百8十8的SC4020全閃配置的是6塊容量為480GB的SSD,可以根據用戶需求以“頗為驚喜的代價”升級為6塊容量為1.92TB的SSD,曾經的“新貴”甩掉偶像包袱啦!
一個小插曲是,測試中前端Oracle數據庫服務器上插的兩塊FC HBA卡,卻只有3條FC通道,企事錄團隊的解釋是一個光模塊出了點問題,實驗室里面也沒有適合的備件。
這個問題倒是很常見,光模塊跟HBA卡、FC交換機不是同一家廠商供貨,指不定就有鏈路不通,或者帶寬降低等兼容性問題。
看過價格和架構,重點來看數據庫性能,見下圖“8K數據塊的隨機讀性能”▼
測試8KB數據塊隨機讀取獲得的結果:最大IOPS接近29萬,平均響應時間在1ms(毫秒)以內,突發響應時間(最大延遲)在32ms左右,這樣看來,性能非常好。我現在使用的高端存儲,配了幾百塊盤,加上優化以及緩存的作用,IOPS也不過才幾萬。
同一個測試中的另一組成績,8KB隨機讀的帶寬最高到2264MB/s,考慮到服務器只是用了3條8Gb/s FC通道,理論帶寬是2400 MB/s,已經可以認為是到達FC通道的極限了。
來自測試團隊的另一組數據證實了我的想法,果然是服務器與FC交換機之間的帶寬瓶頸。
128KB數據順序讀測試結果,最大帶寬2268MB/s,與8KB隨機讀帶寬2264MB/s相差無幾,確認帶寬是瓶頸
想必你也想知道“15萬8的全閃存極限性能在哪里”,企事錄團隊的測試結果,如下面這張統計圖顯示▼
4KB數據塊隨機讀取測試結果,IOPS接近37萬,平均響應時間在1ms以內,最大延遲也在32ms左右,變化不大。
3條8Gb/s FC達到37萬IOPS,但FC通道仍有成為瓶頸的可能。
而國外某權威機構有用6塊SSD測試,IOPS超過10萬。通過我們的驗證,排除一塊熱備盤,國外機構實際使用5塊SSD。企事錄測試團隊實際使用了19塊SSD,接近4倍的盤數量獲得了接近4倍的性能。
這個基準測試成績跟應用性能的差距有多大?
我們調出Oracle性能測試成績來驗證一下▼
Oracle數據庫性能測試主要考慮三個指標,即TPM(Transactions Per Minute,每分鐘在線事務處理數)、TPS(Transactions Per Second,每秒在線事務處理數)和響應時間(ms)。
從上圖可以看出:
峰值TPM最大為64.5萬,平均TPM約為61.5萬;
峰值TPS超過1.1萬,平均TPS在1萬以上;
性能較好,基本與前面基準測試中的8K數據塊隨機讀取的性能相吻合。并且,其平均響應時間為36ms,突發響應時間為250ms,性能的穩定性很好。
單看性能數字,也許對業務部門并不“帶感”,放在具體的業務情景來分析一下:
在今年雙十一開始的頭30分鐘,天貓每秒交易峰值17.5萬筆,相當于17.5萬的峰值TPS;每秒支付峰值12萬筆則相當于12萬峰值TPS。這兩者加起來差不多要接近30萬TPS性能!
簡單換算,不考慮其他因素影響,差不多30臺同等配置的SC4020全閃存陣列就能滿足天貓交易和支付的性能需求(登錄、瀏覽等操作不在此列)。
當然,這個簡單換算只是為了有一個直觀印象,并不反映實際情況。畢竟“雙十一”是全球最大規模的“購物狂歡”,系統架構將是其性能發揮的關鍵。絕大多數企業也不需要達到那么高的交易性能,在能夠完成任務的前提下,,設備越少,其架構的復雜度越小,運維也更加方便。
搞清楚技術問題的種種只是開端,更重要的是,曾經“高富帥”而又甩掉了偶像包袱的全閃存,為存儲重新定義了經濟效益,具體來說,有以下幾個方面:
更低的實際功耗:按照企事錄團隊的算法,目前市面上最快的磁盤是1.5萬轉(RPM)的SAS盤,功耗約為8W(實際為7.92W),IOPS大約為200,要達到10萬IOPS,需要500個硬盤,僅硬盤的功耗就接近4KW(3960W)。也就是說,光是使用磁盤系統,一年的電費就夠買好幾臺全閃存陣列了!
某知名硬盤制造商的一款高性能磁盤——15000 RPM、300GB容量的SAS磁盤,紅框中顯示其平均功耗為7.92W。而SC4020的開機功耗最大為380W左右,10倍于測試配置。
如果使用SC4020這種最大可配置24塊2.5硬盤的2U機箱的話,500個硬盤需要21個機箱,正好滿配一個42U機柜。
而如果要達到企事錄測試獲得的30萬IOPS(實際4K隨機為37萬IOPS,8K為29萬IOPS),則需要1500個硬盤,功耗接近12KW,而SC4020正常運行和全速運行時的功耗為260W-280W之間,不到前者的四十分之一。
更小的占地空間:SC4020滿配24塊SSD,提供超過30萬IOPS,只占用2U高機架空間。而提供10萬IOPS的磁盤系統需要一個滿42U機柜(500 HDD),而提供30萬IOPS的磁盤系統則需要3個滿42U機柜。
卓越的單位I/O成本:從成本的角度來看,提供相同的I/O性能,SC4020的成本遠低于磁盤系統。計算單位IOPS成本,考慮到SC4020在6個SSD的配置下能提供10萬IOPS,而售價才15萬人民幣,相當于每IOPS成本1.5元人民幣,不到2元錢。
需要明確一下,與每IOPS成本相對的則是每GB成本。目前而言,按IOPS成本計,閃存占優,即閃存能夠更好地支撐性能需求型應用;而如果應用主要需要的是大容量的話,則基于低速(7200RPM及以下)大容量硬盤的系統更占優勢,每GB成本更低。
責任編輯:潤月
來源:
51CTO