linux perf是什么?怎么用?(使用總結)

下面由linux系統教程欄目給大家介紹總結關于linux perf的使用方法,希望對需要的朋友有所幫助!

簡介

perf是linux系統中提供的性能分析工具,它基于一個叫“Performance counters”的內核子系統實現,同時支持硬件(CPU、PMU(Performance Monitoring Unit))和軟件(軟件計數器、tracepoint)層面的性能分析。

perf中的事件

perf與其他性能調優工具一樣,都是通過對監測對象進行采樣,根據采樣點的分布來推斷整個程序的行為。通過perf list命令我們可以看到perf支持很多的采樣事件,比如branch-misses、cpu-clock等等。perf中預定義的事件屬于不同的類型,比如硬件產生的事件(cache 命中/分支miss)和軟件產生的事件(context switch/page fault)等等。

tracepoint

tracepoint是linux內核中定義的一些hook,如果被開啟,它們就會在執行到特定邏輯時被觸發,方便其他工具獲取系統內部的運行狀態等信息,perf就是利用了tracepoint,它會記錄和統計tracepoint的各個事件,生成分析報告。

使用方式

perf 工具的具體使用方式如下:

perf?[--version]?[--help]?COMMAND?[ARGS]

其中的COMMAND列表可以通過執行perf –help查看,下面列舉幾個常用的command。

perf stat

perf stat的作用是執行一個命令并收集其運行過程中的各個數據,它可以提供一個程序運行情況的總體概覽。比如:

user@localhost:~$?perf?stat?hostname localhost ?Performance?counter?stats?for?'hostname': ??????????0.313464??????task-clock?(msec)?????????#????0.481?CPUs?utilized?????????? ?????????????????2??????context-switches??????????#????0.006?M/sec?????????????????? ?????????????????0??????cpu-migrations????????????#????0.000?K/sec?????????????????? ???????????????153??????page-faults???????????????#????0.488?M/sec?????????????????? ???????????896,723??????cycles????????????????????#????2.861?GHz???????????????????? ???????????620,709??????instructions??????????????#????0.69??insn?per?cycle????????? ???????????121,143??????branches??????????????????#??386.465?M/sec?????????????????? ?????????????6,247??????branch-misses?????????????#????5.16%?of?all?branches???????? ???????0.000651441?seconds?time?elapsed

上面這個例子,通過perf stat運行了hostname命令,并將其運行過程中的一些指標匯總顯示了出來,比如task-clock、context-switches等待。默認情況下,perf stat 會輸出幾個常用的事件的統計,比如:

task-clock-msecs:cpu?使用率 context-switches:進程切換次數 page-faults:發生缺頁的次數 cpu-migrations:表示進程運行過程中發生了多少次CPU遷移,即被調度器從一個CPU轉移到另外一個CPU上運行 cycles:處理器時鐘,一條機器指令可能需要多個cycles instructions:?機器指令數目 branches:遇到的分支指令數 branch-misses是預測錯誤的分支指令數

除此之外,我們可以使用-e參數來指定我們感興趣的事件,比如:

user@localhost:~$?perf?stat?-e?cache-misses?hostname localhost ?Performance?counter?stats?for?'hostname': ??????????682??????cache-misses???????????????????????????????????????????????? ???????0.000646676?seconds?time?elapsed

perf top

perf top的作用是實時地顯示系統當前的性能統計信息。前面的perf stat用于對一個特定的程序進行分析,而某些時候我們可能并不知道是哪個程序影響了系統性能,這時候就可以用perf top來查找可疑的程序。比如:

Samples:?775??of?event?'cpu-clock',?Event?count?(approx.):?92931021 Overhead??Shared?Object???????Symbol ???8.93%??[kernel]????????????[k]?vsnprintf ???7.73%??perf????????????????[.]?rb_next ???5.92%??[kernel]????????????[k]?kallsyms_expand_symbol.clone.0 ???5.07%??[kernel]????????????[k]?format_decode ???4.59%??[kernel]????????????[k]?number ???3.40%??perf????????????????[.]?symbols__insert ???3.03%??libslang.so.2.2.1???[.]?SLtt_smart_puts

上面的例子顯示perf統計了cpu-clock事件的數據,根據比例進行了排序。和perf stat一樣,我們可以通過-e參數指定統計其他的事件,比如perf top -e context-switches可以查看進程切換最多的top N個進程。

perf record & perf report

perf record的作用和perf stat類似,它可以運行一個命令并生成統計信息,不過perf record不會將結果顯示出來,而是將結果輸出到文件中。perf record生成的文件可以用perf report來進行解析。

perf record還可以通過-g參數,在分析時生成calling graph,幫助定位更上層的邏輯分布。

其他

通過例子我們可以發現,perf的分析結果中的Symbol一列顯示的都是c語言函數的名字。對于java來說,jit編譯產生的函數就會直接顯示在symbol里,而不是java的函數名,這時要定位問題就不是那么容易了,我們需要通過額外的手段將symbol和java程序的符號表對應起來,具體后續再討論了。

推薦學習:《linux系統教程

以上就是

? 版權聲明
THE END
喜歡就支持一下吧
點贊11 分享