非ブロッキング集団通信の通信隠蔽効果に関する調査

Research output: Contribution to journalArticle

Abstract

本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.
Original languageJapanese
Pages (from-to)1-11
Number of pages11
Journal研究報告ハイパフォーマンスコンピューティング(HPC)
Volume162
Issue number17
Publication statusPublished - Dec 11 2017

Cite this

@article{fa55aa040e4a40b6b82851b51b033b97,
title = "非ブロッキング集団通信の通信隠蔽効果に関する調査",
abstract = "本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.",
author = "Takeshi Nanri and Satoshi Ohshima and Kenji Ono",
year = "2017",
month = "12",
day = "11",
language = "Japanese",
volume = "162",
pages = "1--11",
journal = "研究報告ハイパフォーマンスコンピューティング(HPC)",
issn = "2188-8841",
publisher = "一般社団法人情報処理学会",
number = "17",

}

TY - JOUR

T1 - 非ブロッキング集団通信の通信隠蔽効果に関する調査

AU - Nanri, Takeshi

AU - Ohshima, Satoshi

AU - Ono, Kenji

PY - 2017/12/11

Y1 - 2017/12/11

N2 - 本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.

AB - 本稿では,非ブロッキング集団通信による通信隠蔽技術について,特にプログレススレッドを用いた場合の実用上の効果を計測し,評価した.従来の通信隠蔽率のみを計測するベンチマークプログラムでは,プログレススレッドを利用した場合の計算性能の低下による影響が計測結果に反映されないため,実用性の検証が困難である.そこで本稿では,計算と通信を含む総合的な性能評価を行うため,スレッド並列とプロセス並列によるハイブリッド並列のベンチマークプログラムを作成した.このプログラムは,通信と計算の量をそれぞれ明示的に指定するため,プログレススレッドへの CPU コアの割り当て方法やスレッドのスケジューリングポリシーなどの実行時パラメータを変化させた場合の,計測結果の相互比較も可能となった.このプログラムを,Fujitsu PRIMERGY CX 400 および Fujitsu PRIMEHPC FX 100 上で実行し,性能を計測した.その結果,Alltoall では,適切な実行時パラメータを選択することにより,プログラム全体としての性能向上が見込めることが分かった.一方,Allreduce では,特にノード内で複数のプロセスを起動した場合に,性能が低下する場合があることが分かった.これらの結果から,非ブロッキング集団通信の利用にあたっては,使用する集団通信の種類やメッセージサイズ,計算量等に応じて,効果を事前に調査することが重要であることを確認した.また,非ブロッキング集団通信を推進するもう一つの手段であるオフロード機能について,Mellanox 社の SHArP 機能を用いた場合の通信隠蔽効果を予備評価し,通信隠蔽による性能向上が見込めることを確認した.

M3 - 記事

VL - 162

SP - 1

EP - 11

JO - 研究報告ハイパフォーマンスコンピューティング(HPC)

JF - 研究報告ハイパフォーマンスコンピューティング(HPC)

SN - 2188-8841

IS - 17

ER -