VTuneとは?
Intel提供のプロファイラのVTuneですが前回はインストール〜CPUプロファイルを取得しました
今回はGPUプロファイルの取得に挑戦してみましょう
設定
まずは設定です
Configure Analysisの画面で、設定を行います
今回はGPU Offloadを選択しました
(GPU関連のプロファイルは2020.2ではPreviewの機能になっています)

今回使用したアプリケーションはsecurity barrierです
こちらのアプリケーションに下記のようにGPUオプションを使用して試してみます
/home/klf/inference_engine_demos_build/intel64/Release/security_barrier_camera_demo -d GPU -d_va GPU -d_lpr GPU -i /home/klf/benchmark/images/test.mp4 -m /home/klf/openvino_models/ir/intel/vehicle-license-plate-detection-barrier-0106/FP16/vehicle-license-plate-detection-barrier-0106.xml -m_lpr /home/klf/openvino_models/ir/intel/license-plate-recognition-barrier-0001/FP16/license-plate-recognition-barrier-0001.xml -m_va /home/klf/openvino_models/ir/intel/vehicle-attributes-recognition-barrier-0039/FP16/vehicle-attributes-recognition-barrier-0039.xml -no_show -n_iqs 1 -nstreams 1 -nthreads 1
Application部分に
/home/klf/inference_engine_demos_build/intel64/Release/security_barrier_camera_demo
を設定し、パラメータ部分に残りを設定します
あとは右下三角のstartボタンを押すと自動的にプロファイルを取得してくれます

GPUのQueueも見えます

拡大した結果が下記の図となります
処理待ちのGPU処理が確認できます

CLIでプロファイルを取得する
VTuneを使用する際に複数のパラメータを試したい場合があります
今回の場合もパラメータを色々と振りながらとなります
このような場合には、cliでプロファイルを取得すると自動的に取得できます
CPUプロファイルの場合:
vtune -collect hotspots application
GPUプロファイルの場合:
vtune -collect gpu-offload application
実行したディレクトリ内にフォルダができますので、
そのフォルダを下記のコマンドで読み込みます
vtune-gpu フォルダ名
続く

産業用画像処理装置開発、
ゲームコンソール開発、半導体エンジニアなどを経て、
Webエンジニア&マーケティングをやっています
好きな分野はハードウェアとソフトウェアの境界くらい