性能優化技巧之工具選擇
編者按:性能優化,不僅需要對系統和代碼熟悉,更需要一個強有力的工具支持。本文是性能優化系列文章的第三篇,從性能優化要考慮工具的哪些問題開始說起,到性能優化工具都有哪些?本文為您一一介紹。
“工欲善其事,必先利其器”(孔子),雖然“思想比工具更重要”(彎曲網友),但是,如果沒有工具支持,性能優化就會非常累。思想不好掌握,但是使用工具還是比較好學習的,有了工具支持,可以讓初級開發者更容易入門。
性能優化用到的工具,需要考慮哪些方面的問題?
1)使用工具是否需要重新編譯代碼?
一般來說,性能優化工具基本上都需要重新編譯代碼。因為在生產環境里面使用的image,應該是已經優化過的image。不應該在用戶環境里面去調試性能問題。但Build-in的工具有一個好處就是性能測試所用的image和性能調試所用的image是相同的,這樣可以避免重新編譯所帶來的誤差。
2)工具本身對測量結果的影響
如果是Build-in的工具,需要減小工具對性能的影響,啟用工具和不啟用工具對性能的影響應該在一定范圍之內,比如5%,否則不清楚是工具本身影響性能還是被測量的代碼性能下降。
如果是需要重新編譯使用的工具,這里的測試是一個相對值,不能做為性能指標的依據。因為編譯會修改代碼的位置,也可能會往代碼里面加一個測量函數,它生成的image和性能測試的image不一樣。
在這里要列出幾個我用過的Linux工具,其他系統應該也有對應的工具,讀者可以自己搜索。
性能測試工具一般分這么幾種
1)收集CPU的performance counter。CPU里面有很多performance counter,打開之后,會記錄CPU某些事件的數量,比如cache miss, 指令數,指令時間等等。這些counter需要編程才能使用。測量哪一段代碼完全由自己掌握。
2)利用編譯器的功能,在函數入口和出口自動加回調函數,在回調函數里面,記錄入口和出口的時間。收集這些信息,可以得到函數的調用流程和每個函數所花費的時間。
3)自己在代碼里面加入時間測量點,測量某段代碼執行的時間。這種工具看起來和#1的作用差不多,但是由于performance counter編程有很多限制,所以這種工具有時還是有用處的。
在Linux里面,我們經常會用到
1)Oprofile
Oprofile已經加入了linux的內核代碼庫,所以不需要打patch,但是還需要重新編譯內核才可以使用。這是使用最廣泛的linux工具,網上有很多使用指南,讀者可以自己搜索參考。
http://oprofile.sourceforge.net/news/
http://people.redhat.com/wcohen/Oprofile.pdf
2) KFT and Gprof
KFT是kernel的一個patch,只對kernel有效;Gprof是gcc里面的一個工具,只對用戶空間的程序有效。這兩個工具都需要重新編譯代碼,它們都用到了gcc里面的finstrument-functions選項。編譯時會在函數入口,出口加回調函數,而且inline函數也會改成非inline的。它的工作原理可以參考:
http://blog.linux.org.tw/~jserv/archives/001870.html
http://blog.linux.org.tw/~jserv/archives/001723.html
http://elinux.org/Kernel_Function_Trace
http://www.network-theory.co.uk/docs/gccintro/gccintro_80.html
個人認為這是一個非常有用的工具,對讀代碼也有幫助,是居家旅行的必備。這里還有一個slide比較各種工具的,可以看看。
3) Performance counter
http://anton.ozlabs.org/blog/2009/09/04/using-performance-counters-for-linux/
Linux performance counter,用于收集CPU的performance counter,已經加入了內核代碼庫。通常來說,performance counter的粒度太大,基本沒有什么用處,因為沒法定位問題出在哪里;如果粒度太小,就需要手工編程,不能靠加幾個檢查點就可以了。所以還是要結合上面兩個工具一起用才有好的效果。
工具解決哪些問題?
1)幫助建立基線。沒有基線,就沒辦法做性能優化。性能優化是個迭代的過程,指望一次搞定是不現實的。
2)幫助定位問題。這里有兩個涵義:一是性能問題出現在什么地方,是由哪一段代碼引起的;二是性能問題的原因,cache miss,TLB miss還是其他。
3)幫助驗證優化方案。優化的結果應該能在工具里面體現出來,而不是靠蒙。
【編輯推薦】