【工程師筆記】第三期:如何評(píng)估應(yīng)用的存儲(chǔ)性能需求?
做技術(shù)的朋友可能有過(guò)類似這樣的感覺(jué)——每天都會(huì)遇到新的問(wèn)題,或者學(xué)到新的知識(shí)。然而一個(gè)人的時(shí)間和精力畢竟有限,不是所有的崗位都能做到總是親力親為,每人最擅長(zhǎng)的領(lǐng)域也各不相同。為了使工程師自己踩過(guò)的坑、那些實(shí)用的心得體會(huì)也能給大家?guī)?lái)幫助,把經(jīng)驗(yàn)記錄和分享出來(lái)就顯得尤為可貴,這就是我們開(kāi)設(shè)《工程師筆記》專欄的目的。
當(dāng)企業(yè)用戶意識(shí)到他們的應(yīng)用瓶頸出在存儲(chǔ)上,并打算升級(jí)設(shè)備來(lái)解決時(shí),怎樣評(píng)估需要多高的性能,以便做到有的放矢地選擇和配置存儲(chǔ)系統(tǒng)呢?
在本文中,我們將介紹一個(gè)用戶的實(shí)際測(cè)試案例,希望能給大家?guī)?lái)有益的參考。
某公司使用SQL Server進(jìn)行精算,原有設(shè)備和IT架構(gòu)需要用21小時(shí)(4 同步+17計(jì)算)才能完成精算任務(wù)。客戶想縮短精算完成的時(shí)間,大幅度改善數(shù)據(jù)的實(shí)時(shí)性從而提高精算數(shù)據(jù)的價(jià)值。
DPACK是戴爾為客戶提供的免費(fèi)增值工具,專門收集主機(jī)端性能信息,以此協(xié)助存儲(chǔ)解決方案的規(guī)劃和選型。所收集的數(shù)據(jù)會(huì)生成專業(yè)報(bào)告(涵蓋多種不同語(yǔ)言),客戶可以更好了解自己的環(huán)境,基于報(bào)告做出最佳的業(yè)務(wù)決策。
首先在用戶現(xiàn)有的環(huán)境中運(yùn)行DPACK。通過(guò)對(duì)抓取的DPACK報(bào)告進(jìn)行分析,發(fā)現(xiàn)系統(tǒng)的IOPS需求最高達(dá)到15000,而當(dāng)前的P2000存儲(chǔ)(12*600GB 15K)遠(yuǎn)不能滿足應(yīng)用對(duì)IO的需求,所以決定用SC4020全閃寸陣列來(lái)進(jìn)行相關(guān)的測(cè)試。
注:DPACK能夠?qū)τ脩舻拇鎯?chǔ)過(guò)程進(jìn)行拆分分析——包括應(yīng)用下發(fā)到存儲(chǔ),以及存儲(chǔ)設(shè)備自身的處理兩部分。以判斷在存儲(chǔ)不成為瓶頸的情況下,應(yīng)用能夠跑多快。
上面的B拓?fù)鋱D中,在A拓?fù)鋱D的基礎(chǔ)上增加了一臺(tái)Dell Storage SC4020全閃存陣列。測(cè)試結(jié)果如下:
DPACK報(bào)告顯示磁盤吞吐帶寬可達(dá)1112MB/S約8Gb/s
從這里看到SC4020全閃存已經(jīng)起到了效果,但還沒(méi)有達(dá)到客戶預(yù)期的期望值,進(jìn)一步分析基于拓?fù)銪的DPACK報(bào)告,發(fā)現(xiàn)系統(tǒng)的I/O帶寬為8Gbps。由于客戶測(cè)試環(huán)境的限制,SC4020只用了一個(gè)8Gbps SAN光纖交換機(jī)端口;同時(shí)在DPACK報(bào)告中發(fā)現(xiàn)客戶處理器的利用率為90%, 基于以上分析,采用一臺(tái)全新的戴爾PowerEdge R730服務(wù)器 + 8口8Gbps SAN Switch + SC4020的架構(gòu)。
如上圖,在拓?fù)鋱DC中增加了一臺(tái)R730服務(wù)器(配置2顆Xeon E5-2650v3 CPU)以及一個(gè)FC SAN交換機(jī)。提高處理性能的同時(shí)增加了服務(wù)器到SC4020陣列之間的存儲(chǔ)網(wǎng)絡(luò)帶寬。
處理器利用率:從DPACK報(bào)告分析原配置處理器利用率最高接近90%(圖中上半部分);更換處理器后的DPACK報(bào)告顯示處理器利用率明顯降下來(lái)了,最高只有20%(圖中下半部分)。
此時(shí)CPU已經(jīng)不再是瓶頸,那為什么精算時(shí)間沒(méi)有進(jìn)一步縮短呢?
進(jìn)一步分析,當(dāng)前客戶采用的數(shù)據(jù)庫(kù)為SQL Server 2005無(wú)法完全發(fā)揮E5-2600v3處理器的性能,建議客戶升級(jí)到SQL Server 2012。
最終測(cè)試結(jié)果導(dǎo)入到日志文件中,2:02-8:06,共6時(shí)4分
如上圖,采用SQL Server 2012后,精算時(shí)間提高到了6小時(shí),這個(gè)值是目前客戶比較滿意的值了。
進(jìn)一步測(cè)試,SC4020上增加6塊WI(寫密集型)固態(tài)盤試圖提高系統(tǒng)性能,但結(jié)果沒(méi)有變化。說(shuō)明當(dāng)前的SC4020配置已經(jīng)可以滿足客戶的需求了,這個(gè)時(shí)候的系統(tǒng)性能與磁盤系統(tǒng)的IO性能關(guān)系不大。
參考測(cè)試環(huán)境:
1. PowerEdge R730服務(wù)器:2*E5-2650v3 CPU,128GB內(nèi)存,四口千兆網(wǎng)卡,2*300GB 10K硬盤,單塊雙口FC HBA卡
2. SC4020:8Gbps FC主機(jī)接口,6個(gè)400 WI SSD+6個(gè)1.6 TB RI SSD
3. Brocade B300光纖交換機(jī):使用8個(gè)8Gbps
4. 操作系統(tǒng):Windows Server 2008 R2
5. 數(shù)據(jù)庫(kù)環(huán)境:SQL Server 2012
經(jīng)過(guò)多輪測(cè)試,我們得出這樣的結(jié)論:客戶業(yè)務(wù)性能的提升不只是單純靠某一個(gè)子系統(tǒng)(計(jì)算、磁盤等)性能的提升,要進(jìn)行認(rèn)真詳細(xì)的分析才能得出最后的結(jié)論。而且只有硬件的提升是不夠的,需要軟件進(jìn)行相關(guān)的配合。
Dell的DPACK工具是一個(gè)非常好用的系統(tǒng)性能分析工具,可以細(xì)致的分析客戶當(dāng)前IT環(huán)境瓶頸所在。Dell的Power Edge R730+Brocade B300+Compellent SC4020的基礎(chǔ)架構(gòu)組合與SQL Server 2012配合起來(lái),使得精算時(shí)間縮短了將近70%,大幅提高了客戶的數(shù)據(jù)價(jià)值。
像DRACK這類軟件,有些用戶擔(dān)心會(huì)不會(huì)有安全的問(wèn)題?在這方面戴爾明確表示并承諾:該工具只收集系統(tǒng)使用信息!不收集也沒(méi)有讀取任何用戶的數(shù)據(jù)信息!另外我們?cè)俳o出幾條DPACK的最佳實(shí)踐建議供讀者參考:
a. 如果您預(yù)期某天會(huì)出現(xiàn)性能高峰使用,建議在那一天運(yùn)行DPACK信息收集!不建議在低負(fù)載時(shí)期執(zhí)行DPACK(報(bào)告的意義不大!)
b. 建議DPACK收集超過(guò)一天,因?yàn)?4小時(shí)內(nèi)能收集的有用信息太有限了。
c. DPACK不提供任何應(yīng)用程序或數(shù)據(jù)庫(kù)信息,自己要清楚收集是什么應(yīng)用的信息。
相關(guān)內(nèi)容導(dǎo)讀
↓↓↓
【工程師筆記】第一期:小議Linux下磁盤亂序問(wèn)題
【工程師筆記】第二期:巧用iDRAC批量修改PXE網(wǎng)卡啟動(dòng)順序