Home > 一般 > 元のプログラムに勝つ

元のプログラムに勝つ

  • 2012-01-30 (Mon) 19:09
  • 一般

ガーッと6時間くらい連続でプログラムを書いて午前のミーティング前にデバッグもほぼ終了.昼に最後のバグ取りをして完成.

とりあえず,共有メモリなマシン上のMPIで動かして,元のOpenMPのプログラムに比べて数%速い程度の性能になった.バリア同期を全く使わずにバトンの受け渡しのみで全体を動かしていることと,各プロセッサの走る領域が固定なのでキャッシュ効率が高くなってたりすることのメリットがMPIのオーバヘッドを上回ったか? とりあえず24コアで16倍を超えるので満足した.巨大なクラスタで試してみたいけれど使えるクラスタが生きてねぇ……

さらなるチューンとしては,次のプロセッサへのバトン渡しを複数回分まとめて行うようにして,さらに複数回の走査を細切れに折返して進めるようにして1次キャッシュを有効利用する…… とかやると速くなるかなぁ.試してみないとわからんけど速くなったら楽しいな.

閑話休題.

でもなぁ,この計算ってどんだけ需要があるのかよく分からないという問題が…… 今回のを似たような計算に応用できるといいなぁ.

★下記に2つの英単語をスペースで区切って入力してください

Home > 一般 > 元のプログラムに勝つ

Search
Feeds

Page Top