非ブロッキング集団通信の通信隠蔽効果に関する調査

    研究成果: ジャーナルへの寄稿学術誌

    抄録

    本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.
    本文言語日本語
    ページ(範囲)1-11
    ページ数11
    ジャーナル研究報告ハイパフォーマンスコンピューティング(HPC)
    162
    17
    出版ステータス出版済み - 12月 11 2017

    引用スタイル