雙路6500至強 DELL R810機架服務器評測(圖)
Nehalem-EX時代DELL一共發布了三款機器,一款之前測過的刀片服務器M910,以及兩款機架式服務器R810和R910。它們都是四路的機器,不過M910和R810都是屬于可以做四路也可以做二路配置的機型(51CTO推薦閱讀:配4路Nehalem-EX 戴爾M910服務器評測)。
DELL PowerEdge R810
筆者測試過Intel官方送測的Nehalem-EX樣機,對7500系列處理器的表現已經有了一個大致的認識。但是筆者還沒有接觸過同為Nehalem-EX系列的6500系列處理器。R810剛好補全了我們的資料,它是基于6500系列Nehalem-EX:兩個Xeon E6540,規格上看,它和E7540很相似,只是它只能組建兩路系統而已。#p#
較為“輕便”的2U機架服務器
前面板就是傳統的DELL造型,可以搭載6個2.5"熱插拔存儲
冗余電源、4個全高2個半高擴展槽位置,此外還具備了4個網絡接口
#p#
和常見的結構不太一樣,R810的風扇位于機箱靠后的位置,位于處理器和擴展卡之間
電源
處理器前方有一個導風罩
熱插拔風扇組件
#p#
可以安裝四個處理器
處理器板與IO板之間的連接
這個模塊就是DELL的FlexMemory Bridge模塊了
做成了CPU的樣子
內部是SMI和QPI的通道
真正的CPU是這樣的:Xeon E6540
#p#
中央黑色散熱器下的就是SMB芯片
內置的H700陣列卡,PERC 6/i的下一代,SAS 6Gb/s接口
雙Broadcom BCM5709C芯片,每個芯片提供兩個千兆端口,并且每個端口都支持8個RSS隊列
擴展槽Riser
#p#
通過FlexMemory Bridge模塊,達到雙路使用128GB內存的配置(32 DIMMs)。
#p#
SiSoftware Sandra Pro Business 2010
|
||||||
---|---|---|---|---|---|---|
測試對象
|
雙路Intel Nehalem-EP Xeon X5570 2.93GHz |
雙路Intel Westmere-EP Xeon X5670 2.93GHz |
雙路Intel Westmere-EP Xeon X5680 3.33GHz |
Dawning I840-H 四路Intel Dunnington Xeon X7460 2.66GHz @Sandra 2009 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 2.0GHz |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 2.0GHz |
Processor Arithmetic Benchmark
處理器算術性能測試 |
||||||
Aggregate Arithmetic Performance
|
147.17GOPS | 218.69GOPS | 249.2GOPS | 298.6GOPS | 152GOPS | |
Dhrystone iSSE4.2
|
172.5GIPS | 257GIPS | 291.36GIPS | 292201MIPS | 350.47GIPS | 174.32GIPS |
Whetstone iSSE3
|
121.84GFLOPS | 180.41GFLOPS | 207GFLOPS | 208685MFLOPS | 246.73GFLOPS | 129.73GFLOPS |
Processor Multi-Media Benchmark
處理器多媒體性能測試 |
||||||
Aggregate Multi-Media Performance
|
277MPixel/s | 410.36MPixel/s | 465.8MPixel/s | 753.51MPixel/s | 562.11MPixel/s | 288.38MPixel/s |
Multi-Media Int x16 iSSE4.1
|
317.13MPixel/s | 470.51MPixel/s | 534.13MPixel/s | 283.27MPixel/s | 646.86MPixel/s | 330.77MPixel/s |
Multi-Media Float x8 iSSE2
|
237MPixel/s | 350.2MPixel/s | 397.47MPixel/s | 501.36MPixel/s | 477.37MPixel/s | 246MPixel/s |
Multi-Media Double x4 iSSE2
|
128.62MPixel/s | 190.87MPixel/s | 216.17MPixel/s | 260.18MPixel/s | 260MPixel/s | 133.57MPixel/s |
Multi-Core Efficiency Benchmark
多核效率測試 |
||||||
Inter-Core Bandwidth
|
71.15GB/s | 80.7GB/s | 84GB/s | 12.88GB/s | 106.67GB/s | |
Inter-Core Latency
(越小越好) |
18ns | 18ns | 16ns | 110ns | 23ns | |
Cryptography Benchmark
加密解密性能測試 |
||||||
Cryptographic Bandwidth
|
1.26GB/s | 10.33GB/s | 11.72GB/s | 3GB/s | 1.52GB/s | |
AES128-ECB iAES
Cryptographic Bandwidth |
1GB/s | 18.45GB/s | 21GB/s | 2.88GB/s | 1.46GB/s | |
SHA256 iSSE4 Hashing Bandwidth
|
1.49GB/s | 2.22GB/s | 2.52GB/s | 3GB/s | 1.58GB/s | |
.NET Arithmetic Benchmark
.NET算術性能測試 |
||||||
Aggregate .NET Performance
|
55.84GOPS | 73.6GOPS | 80.22GOPS | 89.47GOPS | 58.34GOPS | |
Dhrystone .NET
|
32.11GIPS | 32.2GIPS | 37GIPS | 75397MIPS | 31.67GIPS | 33.36GIPS |
Whetstone .NET
|
79.56GFLOPS | 115GFLOPS | 123.43GFLOPS | 136088MFLOPS | 147.26GFLOPS | 83.32GFLOPS |
.NET Multi-Media Benchmark
.NET多媒體性能測試 |
||||||
Aggregate .NET Multi-Media Performance
|
42.13MPixel/s | 63.18MPixel/s | 71.4MPixel/s | 90MPixel/s | 45.8MPixel/s | |
Multi-Media Int x1 .NET
|
59MPixel/s | 88.64MPixel/s | 100.36MPixel/s | 119.30MPixel/s | 127.38MPixel/s | 64.34MPixel/s |
Multi-Media Float x1 .NET
|
25.22MPixel/s | 37.73MPixel/s | 42.42MPixel/s | 31.74MPixel/s | 52.7MPixel/s | 27.27MPixel/s |
Multi-Media Double x1 .NET
|
48.3MPixel/s | 68.45MPixel/s | 78.48MPixel/s | 58.72MPixel/s | 102.48MPixel/s | 52.22MPixel/s |
大致上,雙路E6540的運算性能是四路E7540的一半多一些,和預想的差不多。
#p#
SiSoftware Sandra Pro Business 2010
|
||||||
---|---|---|---|---|---|---|
測試對象
|
雙路Intel Nehalem-EP Xeon X5570 2.93GHz |
雙路Intel Westmere-EP Xeon X5670 2.93GHz |
雙路Intel Westmere-EP Xeon X5680 3.33GHz |
Dawning I840-H 四路Intel Dunnington Xeon X7460 2.66GHz @Sandra 2009 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 2.0GHz |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 2.0GHz |
Memory Bandwidth Benchmark
內存帶寬測試 |
||||||
Aggregate Memory Performance
|
38GB/s | 35GB/s | 35.2GB/s | 33.86GB/s | 33.2GB/s | |
Int Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 35.2GB/s | 3.49GB/s | 33.86GB/s | 33.18GB/s |
Float Buff'd iSSE2 Memory Bandwidth
|
38GB/s | 35GB/s | 35.18GB/s | 3.49GB/s | 33.85GB/s | 33.23GB/s |
Memory Latency Benchmark(Random)
內存延遲測試(隨機) |
||||||
Memory(Random Access) Latency
(越小越好) |
80ns | 83ns | 82ns | 192ns | 161ns(min) | |
Speed Factor
(越小越好) |
55.50 | 57.00 | 64.60 | 98.10 | 90 | |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks | 4clocks | |
L2 On-board Cache
|
11clocks | 10clocks | 10clocks | 10clocks | 9clocks | |
L3 On-board Cache
|
49clocks | 57clocks | 60clocks | 84clocks | 97clocks | |
Memory Latency Benchmark(Linear)
內存延遲測試(線性) |
||||||
Memory(Linear Access) Latency
(越小越好) |
7ns | 7ns | 7ns | 41ns | 32ns(min) | |
Speed Factor
(越小越好) |
4.80 | 5.10 | 5.50 | 20.70 | 17.20 | |
Internal Data Cache
|
4clocks | 4clocks | 4clocks | 4clocks | 4clocks | |
L2 On-board Cache
|
10clocks | 11clocks | 11clocks | 10clocks | 9clocks | |
L3 On-board Cache
|
13clocks | 13clocks | 13clocks | 34clocks | 35~45clocks | |
Cache and Memory Benchmark
緩存及內存測試 |
||||||
Cache/Memory Bandwidth
|
142GB/s | 183.26GB/s | 195.6GB/s | 315GB/s | 182GB/s | |
Speed Factor
(越小越好) |
21.20 | 31.00 | 35.20 | 34.80 | 17.60 | |
Internal Data Cache
|
471GB/s | 663.51GB/s | 744.49GB/s | 919.66GB/s | 489.14GB/s | |
L2 On-board Cache
|
295.4GB/s | 537.88GB/s | 611GB/s | 749GB/s | 382.72GB/s | |
L3 On-board Cache
|
112GB/s | 146.33GB/s | 159GB/s | 336.6GB/s | 215.64GB/s |
內存帶寬上,雙路E6540和四路E7540差不多,因為雙路配置下E6540使用了所有的內存控制器,而四路E7540只使用了一個,兩個配置下總的內存通道數量是一樣的。延遲上,雙路E6540配置還要略低一些。
#p#
SPEC CPU 2006整數運算主要包含編譯、壓縮、人工智能、視頻壓縮轉換、XML處理等,此外,各種日常操作也主要是基于整數操作。SPEC CPU 2006的整數運算包含了400.perlbench PERL編程語言、401.bzip2 壓縮、403.gcc C編譯器、429.mcf 組合優化、445.gobmk 人工智能:圍棋、456.hmmer 基因序列搜索、458.sjeng 人工智能:國際象棋、462.libquantum 物理:量子計算、464.h264ref 視頻壓縮、471.omnetpp 離散事件仿真、473.astar 尋路算法、483.xalancbmk XML處理共12項。
前面得出,純計算能力單個E6540和E7540沒什么差別,組成雙路的效率比四路的效率還要略高一點。現在,SPEC得出的整數運算吞吐量,R810達到了M910的69.4%,這表明,R810的雙路處理器因為使用了完整的兩個內存控制器而得到了實際運算效果的提升,比較明顯的462.libquantum 量子計算項目就是這樣。
#p#
SPEC CPU 2006的浮點運算測試包括的全部都是科學運算,科學運算需要用到大量的高精度浮點數據,如410.bwaves 流體力學、416.gamess 量子化學、433.milc 量子力學、434.zeusmp 物理:計算流體力學、435.gromacs 生物化學/分子力學、436.cactusADM 物理:廣義相對論、437.leslie3d 流體力學、444.namd 生物/分子、447.dealII 有限元分析、450.soplex 線形編程、優化、453.povray 影像光線追蹤、454.calculix 結構力學、459.GemsFDTD 計算電磁學、465.tonto 量子化學、470.lbm 流體力學、481.wrf 天氣預報、482.sphinx3 語音識別共17項測試。
在浮點運算吞吐量上,R810還要比M910高一些(4%),雖然不同的項目有高有低,但是這表明了內存帶寬也是很重要的。
#p#
CineBench R11.5 64bit
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
顯卡 | - | - | - | - | - |
CPU Benchmark
|
|||||
Rendering (1 CPU) | 1.02 pts | 1.02 pts | 1.16 pts | 0.78 pts | 0.79 pts |
Rendering (x CPU) | 9.92 pts | 14.58 pts | 16.40 pts | 19.26 pts | 10.32 pts |
Threads | 16 | 24 | 24 | 48 | 24 |
Multiprocessor Speedup | 9.68x | 14.33x | 14.18x | 24.65x | 13.14x |
這個測試比較側重于更多的計算核心。
#p#
MMM - Matrix-Matrix Multiplicaion Benchmark
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
單位 | GFLOPS | GFLOPS | GFLOPS | GFLOPS | GFLOPS |
Threads 1
|
|||||
5000 step | 7.821975 | 7.842319 | 8.877563 | 5.867645 | 6.007474 |
10000 step | 7.890761 | 7.840417 | 8.883291 | 5.865347 | 5.984136 |
15000 step | 7.888751 | 7.845479 | 8.881528 | 5.826604 | 5.90173 |
Threads 2
|
|||||
5000 step | 15.59136 | 15.62796 | 17.5891 | 11.570261 | 11.815215 |
10000 step | 15.7544 | 15.66469 | 17.73566 | 11.689317 | 11.870882 |
15000 step | 15.7445 | 15.64657 | 17.67208 | 11.602247 | 11.796412 |
Threads 4
|
|||||
5000 step | 30.69218 | 29.99696 | 34.85343 | 21.788607 | 22.342354 |
10000 step | 31.02227 | 29.75883 | 34.90105 | 22.21115 | 22.337463 |
15000 step | 31.04954 | 30.55926 | 34.92557 | 22.073702 | 22.299975 |
Threads 8
|
|||||
5000 step | 36.2252 | 49.03697 | 45.99856 | 41.228878 | 28.497565 |
10000 step | 38.21083 | 50.30305 | 45.99856 | 43.472432 | 29.396352 |
15000 step | 40.71236 | 56.00031 | 47.74417 | 43.37777 | 37.193253 |
Threads 16
|
|||||
5000 step | 59.38371 | 64.04222 | 66.10022 | 73.379889 | 44.935817 |
10000 step | 61.44583 | 62.42291 | 72.38159 | 78.596851 | 51.056532 |
15000 step | 61.83442 | 64.3761 | 73.2495 | 79.099092 | 54.979568 |
Threads 24
|
|||||
5000 step | 54.82514 | 84.13599 | 66.10022 | 94.000418 | 60.406535 |
10000 step | 54.82514 | 88.58685 | 72.38159 | 124.028823 | 63.634763 |
15000 step | 59.18915 | 90.12297 | 73.2495 | 124.574801 | 64.72546 |
Threads 48
|
|||||
5000 step | 97.335138 | ||||
10000 step | 119.780984 | ||||
15000 step | 121.637469 |
和Sandra得出的結果差不多。
SunGard Adaptiv Analytics Benchmark v4.0
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
Threads | 16 | 24 | 24 | 48 | 24 |
Time (lower is better) |
138.076s | 110.331s | 94.911s | 139.512s | 147.716s |
black_scholes
|
|||||
處理器 | 雙路Intel Nehalem-EP Xeon X5570 |
雙路Intel Westmere-EP Xeon X5670 |
雙路Intel Westmere-EP Xeon X5680 |
DELL PowerEdge M910 四路Intel Nehalem-EX Xeon E7540 |
DELL PE R810 雙路Intel Nehalem-EX Xeon E6540 |
Threads | 16 | 24 | 24 | 48 | 24 |
Time (lower is better) |
9.17s | 6.16s | 5.51s | 4.40s | 8.28s |
更多的計算能力在這兩個測試里面是更好的。
#p#
16萬TPS左右,比M910還要高點。數據庫測試對內存帶寬和內存延遲比較敏感。
測試時網絡占用率
#p#
R810是DELL推出的基于Nehalem-EX處理器的2U服務器,它可以配置為2路也可以配置為4路。R810提供了32個DIMM的內存支持能力,***容量達512GB,通過DELL的FlexMemory Bridge技術,R810在2路配置下也能完全使用這32個DIMM。R810還支持冗余電源和四個BCM5709C千兆網絡端口,通過H700提供了SAS 6Gb/s的陣列支持能力。R810支持6個2.5"熱插拔硬盤。
DELL PowerEdge R810
樣機配置的是兩個Xeon E6540處理器,它和E7540基本沒什么區別,除了只能用于雙路配置之外。在使用了兩個DELL的FlexMemory Bridge模塊之后,每個E6540處理器可以應用完整的兩個內存控制器以及對應的16個DIMM,從而獲得了不錯的性能表現,和四路配置的M910相比是互有上下,因為后者每個處理器僅使用了一個內存控制器。我們認為,M910和R910都更適合于雙路配置,不過,一些應用下,四路配置也是可以選擇的。
【編輯推薦】