抄録
階層型行列は小さな密行列と低ランク近似行列から構成される行列である.密行列を階層型行列によって近似することで,大規模な計算をより少ないメモリ量で行うことが可能となる.しかし階層型行列を用いた計算は複雑であるため,最適化が求められている.我々はこれまで階層型行列を用いた境界要素法による静電場解析問題の実装と評価をマルチコア CPU やメニーコアプロセッサにて実施してきた.本稿では,階層型行列を係数行列に持つ線形方程式に対する反復法を対象として,GPU クラスタ上での性能評価や最適化に取り組んだ結果を示す.主要な計算部である階層型行列ベクトル積計算を構成する密行列ベクトル積計算を MAGMA BLAS に行わせることで高速化を目指したところ,GPU カーネル起動のオーバーヘッドにより実行時間が増大したが,BATCHED MAGMA を用いることで大幅に性能が改善した.実験環境としては TSUBAME 2.5 (最大 8 ノード / 1 ノードあたり 1 GPU) および Reedbush-H (最大 8 ノード / 1 ノードあたり 1 GPU) を使用し,それぞれ 8 ノードまで性能向上は得られたが,ノード数を増やした場合には MPI 処理の時間も目立ってきており,さらなる最適化が求められる結果となった.
本文言語 | 日本語 |
---|---|
ページ(範囲) | 1-8 |
ページ数 | 8 |
ジャーナル | 研究報告ハイパフォーマンスコンピューティング(HPC) |
巻 | 160 |
号 | 14 |
出版ステータス | 出版済み - 7月 19 2017 |