Linux在具有高穩定性、可靠性的同時,具有很好的可伸縮性和擴展性,能夠針對不同的應用和硬件環境調整,優化出滿足當前應用需要的最佳性能。因此企業在維護
Linux系統、進行系統調優時,了解系統性能分析工具是至關重要的。
在Linux下有很多系統性能分析工具,比較常見的有top、free、ps、time、timex、uptime等。下文將介紹幾個較為重要的性能分析工具vmstat、iostat和sar及其使用。
用vmstat監視內存使用情況
vmstat是Virtual Meomory Statistics(虛擬內存統計)的縮寫,可對操作系統的虛擬內存、進程、CPU活動進行監視。它是對系統的整體情況進行統計,不足之處是無法對某個進程進行深入分析。
首先,什么是virtual memory? 簡單的說,linux支持應用程序使用比實際內存更大的內存空間,這是通過將硬盤上一個特定的分區(swap分區)或者一個特定的文件作為內存的擴展來做到的。當實際內存不夠用時,linux根據某種策略,將內存中的部分空間寫到交換分區以便留出應用程序運行所需要的內存空間(參考:Understanding Virtual Memory , What is Vitual Memory)。但是,一旦開始使用交換空間,磁盤活動自然就多起來,cpu利用率就降低下來(因為磁盤的速度比內存和cpu慢多了)。這就是為什么vmstat會同時顯示磁盤和cpu活動情況的原因。
vmstat的語法如下:
CODE:
vmstat [-V] [-n] [delay [count]]
[Copy to clipboard]
其中,-V表示打印出版本信息;-n表示在周期性循環輸出時,輸出的頭部信息僅顯示一次;delay是兩次輸出之間的延遲時間;count是指按照這個時間間隔統計的次數。
vmstat輸出的各個字段的含義可以參考man vmstat的解釋,下面就我的理解說一下vmstat常用的幾種使用方式。
1、觀察磁盤活動情況
磁盤活動情況主要從以下幾個指標了解:
bi:表示從磁盤每秒讀取的塊數(blocks/s)。數字越大,表示讀磁盤的活動越多。
bo:表示每秒寫到磁盤的塊數(blocks/s)。數字越大,表示寫磁盤的活動越多。
wa:cpu等待磁盤I/O(未決的磁盤IO)的時間比例。數字越大,表示文件系統活動阻礙cpu的情況越嚴重,因為cpu在等待慢速的磁盤系統提供數據。wa為0是最理想的。如果wa經常大于10,可能文件系統就需要進行性能調整了。
procs:
r-->在運行隊列中等待的進程數
b-->在等待io的進程數
w-->可以進入運行隊列但被替換的進程
memoy
swap-->現時可用的交換內存(k表示)
free-->空閑的內存(k表示)
pages
re--》回收的頁面
mf--》非嚴重錯誤的頁面
pi--》進入頁面數(k表示)
po--》出頁面數(k表示)
fr--》空余的頁面數(k表示)
de--》提前讀入的頁面中的未命中數
sr--》通過時鐘算法掃描的頁面
disk 顯示每秒的磁盤操作。 s表示scsi盤,0表示盤號
fault 顯示每秒的中斷數
in--》設備中斷
sy--》系統中斷
cy--》cpu交換
cpu 表示cpu的使用狀態
cs--》用戶進程使用的時間
sy--》系統進程使用的時間
id--》cpu空閑的時間
如果 r經常大于 4 ,且id經常少于40,表示cpu的負荷很重。
如果pi,po 長期不等于0,表示內存不足。
如果disk 經常不等于0, 且在 b中的隊列 大于3, 表示 io性能不好。
2、觀察cpu活動情況
vmstat比top更能反映出cpu的使用情況:
us:用戶程序使用cpu的時間比例。這個數字越大,表示用戶進程越繁忙。
sy:系統調用使用cpu的時間比例。注意,NFS由于是在內核里面運行的,所以NFS活動所占用的cpu時間反映在sy里面。這個數字經常很大的話,就需要注意是否某個內核進程,比如NFS任務比較繁重。如果us和sy同時都比較大的話,就需要考慮將某些用戶程序分離到另外的服務器上面,以免互相影響。
id:cpu空閑的時間比例。
wa:cpu等待未決的磁盤IO的時間比例。
用iostat監視I/O子系統情況
iostat是I/O statistics(輸入/輸出統計)的縮寫,iostat工具將對系統的磁盤操作活動進行監視。它的特點是匯報磁盤活動統計情況,同時也會匯報出CPU使用情況。同vmstat一樣,iostat也有一個弱點,就是它不能對某個進程進行深入分析,僅對系統的整體情況進行分析。
iostat的語法如下:
CODE:
iostat [ -c | -d ] [ -k ] [ -t ] [ -V ] [ -x [ device ] ] [ interval [ count ] ]
[Copy to clipboard]
其中,-c為匯報CPU的使用情況;-d為匯報磁盤的使用情況;-k表示每秒按kilobytes字節顯示數據;-t為打印匯報的時間;-v表示打印出版本信息和用法;-x device指定要統計的設備名稱,默認為所有的設備;interval指每次統計間隔的時間;count指按照這個時間間隔統計的次數。
iostat一般的輸出格式如下:
CODE:
Linux 2.4.18-18smp (builder.linux.com) 2003年03月07日
avg-cpu: %user %nice %sys %idle
4.81 0.01 1.03 94.15
Device: tps Blk_read/s Blk_wrtn/s Blk_read Blk_wrtn
dev3-0 30.31 1117.68 846.52 16104536 12197374
dev3-1 7.06 229.61 40.40 3308486 582080
[Copy to clipboard]
device顯示設備名
r/s顯示每秒讀磁盤操作的次數
w/s 顯示每秒寫磁盤操作的次數
kr/s 顯示每秒讀數據總量 單位K
kw/s 顯示每秒寫數據總量 單位K
wait 顯示平均的等待事務數量
actv 顯示正在處理的平均事務總量
svc_t 顯示憑據服務周期 單位 ms
%w 顯示等待時間的百分數
%b 顯示磁盤工作時間的百分數
對于輸出中各字段的含義,iostat的幫助中有詳細的說明。
使用sar進行綜合分析
引用:
表1 sar參數說明
選項 功能
-A 匯總所有的報告
-a 報告文件讀寫使用情況
-B 報告附加的緩存的使用情況
-b 報告緩存的使用情況
-c 報告系統調用的使用情況
-d 報告磁盤的使用情況
-g 報告串口的使用情況
-h 報告關于buffer使用的統計數據
-m 報告IPC消息隊列和信號量的使用情況
-n 報告命名cache的使用情況
-p 報告調頁活動的使用情況
-q 報告運行隊列和交換隊列的平均長度
-R 報告進程的活動情況
-r 報告沒有使用的內存頁面和硬盤塊
-u 報告CPU的利用率
-v 報告進程、i節點、文件和鎖表狀態
-w 報告系統交換活動狀況
-y 報告TTY設備活動狀況
sar是System Activity Reporter(系統活動情況報告)的縮寫。顧名思義,sar工具將對系統當前的狀態進行取樣,然后通過計算數據和比例來表達系統的當前運行狀態。它的特點是可以連續對系統取樣,獲得大量的取樣數據;取樣數據和分析的結果都可以存入文件,所需的負載很小。sar是目前Linux上最為全面的系統性能分析工具之一,可以從14個大方面對系統的活動進行報告,包括文件的讀寫情況、系統調用的使用情況、串口、CPU效率、內存使用狀況、進程活動及IPC有關的活動等,使用也是較為復雜。
sar的語法如下:
CODE:
sar [-option] [-o file] t [n]
[Copy to clipboard]
它的含義是每隔t秒取樣一次,共取樣n次。其中-o file表示取樣結果將以二進制形式存入文件file中。
另一種語法如下:
CODE:
sar [-option] [-s time] [-e time] [-i sec] [-f file]
[Copy to clipboard]
含義是表示從file文件中取出數據,如果沒有指定-f file,則從標準數據文件/var/adm/sa/sadd取數據,其中dd表示當前天。另外,-s time表示起始時間;-e time表示停止時間;-i sec表示取樣的時間間隔,如果不指定則表示取文件中所有的數據。對于具體的選項參見表1。
一般它與-q和-u聯合使用,以便對每個CPU的使用情況進行分析,比如運行如下命令:
CODE:
sar -q -u 5 1
[Copy to clipboard]
將輸出如下:
CODE:
Linux 2.4.18-18smp (builder.linux.com) 2003年03月07日
09時46分16? CPU %user %nice %system %idle
09時46分21? all 0.20 0.00 0.00 99.80
09時46分16? runq-sz plist-sz ldavg-1 ldavg-5
09時46分21? 0 91 0.00 0.00
Average: CPU %user %nice %system %idle
Average: all 0.20 0.00 0.00 99.80
Average: runq-sz plist-sz ldavg-1 ldavg-5
Average: 0 91 0.00 0.00
[Copy to clipboard]
由于sar命令太復雜,只有通過熟練使用才能了解每個選項的含義,對于sar輸出中每個字段的含義運行man sar命令可以得到詳細的解釋。