2012年01月30日
元のプログラムに勝つ
- 2012-01-30 (Mon)
- 一般
ガーッと6時間くらい連続でプログラムを書いて午前のミーティング前にデバッグもほぼ終了.昼に最後のバグ取りをして完成.
とりあえず,共有メモリなマシン上のMPIで動かして,元のOpenMPのプログラムに比べて数%速い程度の性能になった.バリア同期を全く使わずにバトンの受け渡しのみで全体を動かしていることと,各プロセッサの走る領域が固定なのでキャッシュ効率が高くなってたりすることのメリットがMPIのオーバヘッドを上回ったか? とりあえず24コアで16倍を超えるので満足した.巨大なクラスタで試してみたいけれど使えるクラスタが生きてねぇ……
さらなるチューンとしては,次のプロセッサへのバトン渡しを複数回分まとめて行うようにして,さらに複数回の走査を細切れに折返して進めるようにして1次キャッシュを有効利用する…… とかやると速くなるかなぁ.試してみないとわからんけど速くなったら楽しいな.
閑話休題.
でもなぁ,この計算ってどんだけ需要があるのかよく分からないという問題が…… 今回のを似たような計算に応用できるといいなぁ.
- Comments: 0
- TrackBack (Close): -