VTune でプロファイルをとる(2)GPU編

VTuneとは?

Intel提供のプロファイラのVTuneですが前回はインストール〜CPUプロファイルを取得しました
今回はGPUプロファイルの取得に挑戦してみましょう

設定

まずは設定です
Configure Analysisの画面で、設定を行います
今回はGPU Offloadを選択しました
(GPU関連のプロファイルは2020.2ではPreviewの機能になっています)

今回使用したアプリケーションはsecurity barrierです
こちらのアプリケーションに下記のようにGPUオプションを使用して試してみます

/home/klf/inference_engine_demos_build/intel64/Release/security_barrier_camera_demo -d GPU -d_va GPU -d_lpr GPU -i /home/klf/benchmark/images/test.mp4 -m /home/klf/openvino_models/ir/intel/vehicle-license-plate-detection-barrier-0106/FP16/vehicle-license-plate-detection-barrier-0106.xml -m_lpr /home/klf/openvino_models/ir/intel/license-plate-recognition-barrier-0001/FP16/license-plate-recognition-barrier-0001.xml -m_va /home/klf/openvino_models/ir/intel/vehicle-attributes-recognition-barrier-0039/FP16/vehicle-attributes-recognition-barrier-0039.xml -no_show -n_iqs 1 -nstreams 1 -nthreads 1

Application部分に
/home/klf/inference_engine_demos_build/intel64/Release/security_barrier_camera_demo
を設定し、パラメータ部分に残りを設定します

あとは右下三角のstartボタンを押すと自動的にプロファイルを取得してくれます

GPUのQueueも見えます

拡大した結果が下記の図となります
処理待ちのGPU処理が確認できます

CLIでプロファイルを取得する

VTuneを使用する際に複数のパラメータを試したい場合があります
今回の場合もパラメータを色々と振りながらとなります
このような場合には、cliでプロファイルを取得すると自動的に取得できます

CPUプロファイルの場合:
vtune -collect hotspots application

GPUプロファイルの場合:
vtune -collect gpu-offload application

実行したディレクトリ内にフォルダができますので、
そのフォルダを下記のコマンドで読み込みます

vtune-gpu フォルダ名

続く