通過命令vmstat查看Linux系統負載性能,查看分析信息詳解
一、簡介
vmstat命令: 用來獲得有關進程、內存、頁面交換空間及 CPU活動的信息。這些信息反映了系統的負載情況。
二、使用vmstat
參數用法
vmstat [-a] [-n] [-S unit] [delay [ count]]
vmstat [-s] [-n] [-S unit]
vmstat [-m] [-n] [delay [ count]]
vmstat [-d] [-n] [delay [ count]]
vmstat [-p disk partition] [-n] [delay [ count]]
vmstat [-f]
vmstat [-V]
-a:顯示活躍和非活躍內存
-f:顯示從系統啟動至今的fork數量 。
-m:顯示slabinfo
-n:只在開始時顯示一次各字段名稱。
-s:顯示內存相關統計信息及多種系統活動數量。
delay:刷新時間間隔。如果不指定,只顯示一條結果。
count:刷新次數。如果不指定刷新次數,但指定了刷新時間間隔,這時刷新次數為無窮。
-d:顯示磁盤相關統計信息。
-p:顯示指定磁盤分區統計信息
-S:使用指定單位顯示。參數有 k 、K 、m 、M ,分別代表1000、1024、1000000、1048576字節(byte)。默認單位為K(1024 bytes)
-V:顯示vmstat版本信息。
三、vmstat信息查看
常用命令如下:
vmstat 1 10
1表示每隔1秒采集一次服務器狀態,10表示只采集10次。
Procs(進程):
- r:運行隊列中進程數量,這個值也可以判斷是否需要增加CPU。(長期大于1),當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關系,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,服務器的狀態很危險。
- b:等待IO的進程數量,及阻塞的進程。
Memory(內存):
- swpd:使用虛擬內存大小,如果大于0,表示你的機器物理內存不足了,如果不是程序內存泄露的原因,那么你該升級內存了或者把耗內存的任務遷移到其他機器。
注意:如果swpd的值不為0,但是SI,SO的值長期為0,這種情況不會影響系統性能。
- free:空閑物理內存大小
- buff:用作緩沖的內存大小,inux/Unix系統是用來存儲,目錄里面有什么內容,權限等的緩存
- cache:用作緩存的內存大小 (這里是Linux/Unix的聰明之處,把空閑的物理內存的一部分拿來做文件和目錄的緩存,是為了提高 程序執行的性能,當程序使用內存時,buffer/cached會很快地被使用。)
注意:如果cache的值大的時候,說明cache處的文件數多,如果頻繁訪問到的文件都能被cache處,那么磁盤的讀IO bi會非常小。
Swap:
- si:每秒從交換區寫到內存的大小,由磁盤調入內存,如果這個值大于0,表示物理內存不夠用或者內存泄露了,要查找耗內存進程解決掉。
- so:每秒寫入交換區的內存大小,由內存調入磁盤,如果這個值大于0,同上。
注意:內存夠用的時候,這2個值都是0,如果這2個值長期大于0時,系統性能會受到影響,磁盤IO和CPU資源都會被消耗。有些朋友看到空閑內存(free)很少的或接近于0時,就認為內存不夠用了,不能光看這一點,還要結合si和so,如果free很少,但是si和so也很少(大多時候是0),那么不用擔心,系統性能這時不會受到影響的。
IO:(現在的Linux版本塊的大小為1kb)
- bi:每秒讀取的塊數,塊設備每秒接收的塊數量,這里的塊設備是指系統上所有的磁盤和其他塊設備,默認塊大小是1024byte。
- bo:每秒寫入的塊數,塊設備每秒發送的塊數量,例如我們讀取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO過于頻繁,需要調整。
注意:隨機磁盤讀寫的時候,這2個值越大(如超出1024k),能看到CPU在IO等待的值也會越大。
系統:
- in:每秒中斷數,包括時鐘中斷。
- cs:每秒上下文切換數。每秒上下文切換次數,例如我們調用系統函數,就要進行上下文切換,線程的切換,也要進行上下文切換,這個值要越小越好,太大了,要考慮調低線程或者進程的數目,例如在apache和nginx這種web服務器中,我們一般做性能測試時會進行幾千并發甚至幾萬并發的測試,選擇web服務器的進程可以由進程或者線程的峰值一直下調,壓測,直到cs到一個比較小的值,這個進程和線程數就是比較合適的值了。系統調用也是,每次調用系統函數,我們的代碼就會進入內核空間,導致上下文切換,這個是很耗資源的,也要盡量避免頻繁調用系統函數。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU干正經事的時間少了,CPU沒有充分利用,是不可取的。
注意:上面2個值越大,會看到由內核消耗的CPU時間會越大。
CPU(以百分比表示):
- us:用戶進程執行時間百分比(user time)
注意: us的值比較高時,說明用戶進程消耗的CPU時間多,但是如果長期超50%的使用,那么我們就該考慮優化程序算法或者進行加速。
- sy:內核系統進程執行時間百分比(system time), 系統CPU時間,如果太高,表示系統調用時間長,例如是IO操作頻繁
注意:sy的值高時,說明系統內核消耗的CPU資源多,這并不是良性表現,我們應該檢查原因。
- wa:IO等待時間百分比,等待IO時間,wa的值高時,說明IO等待比較嚴重,這可能由于磁盤大量作隨機訪問造成,也有可能磁盤出現瓶頸。
注意:wa的值高時,說明IO等待比較嚴重,這可能由于磁盤大量作隨機訪問造成,也有可能磁盤出現瓶頸(塊操作)。
- id:空閑時間百分比,空閑 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閑CPU使用率,us是用戶CPU使用率,sy是系統CPU使用率
- wt:等待IO CPU時間。