No Such Blog or Diary

«Prev || 1 | 2 | 3 |...| 857 | 858 | 859 |...| 1337 | 1338 | 1339 || Next»

強制貯金?

これまで大学では第一生命のセールスレディにしか会ったことがなかったのだけど,今日は日本生命のセールスレディが来た.来週また来てお話聴いて頂戴なということらしい.まあ,話を聞くだけならただなので聞くとして……

そういえば現状の保険契約がどんなだったっけかなぁと家に帰って調べてみた.とりあえず今死ぬと Canon の 200mm ~ 1200mm の最大口径単焦点を揃えられるらしい.まあ,死ぬとお得な貯金と思って色々始めたのでそんなもんか.

SSEを使い出す

ちょっとループを変形して自分でベクタライズしてSSEが刺さるようにしてみたら計算時間が3/4位には縮まった.まあ,SSEでは double 2つ分しか並列化されないのでこんなもんか.AVXが使えればもう一声速くなるか?

とりあえず強制パイプライン化による加速パラメータの劣化が結構痛いのでちょっとストールが入ってしまうけれど別の並列化を導入しよう.ただの趣味なので査読に飽きたら処理する.

平方根なしにしてみたけれど

実行時間が2/3になったけれど,ただそれのみ.キャッシュを効かせるために複数の走査をまとめようとすると収束を加速するためのパラメータの精度が落ちて時間が伸びる.

もっと頭使わないとダメそうだけどそろそろ諦めよう.とりあえず知見は得た.

回らない電子レンジ

まあ,11年も使ってれば壊れもするか.温め出来なくはないけれどむらがひどすぎて使えん.オーブン機能だけのためにとっておいても邪魔なので新しくしよう.

さて,とりあえず最近の製品のサーベイから始めないと.

で,三菱電機のレンジグリルZITANGとか良さげに見える.サイズ的に今のとあまり変わらないし.グリルができると色々と面白そうだし.

と思ってたら.あー,まだ時々皿が回るなぁ.もう暫く様子見るか.

キャッシュ効率以前の問題だった

キャッシュの効きが良くなるようにプログラムの流れを変えてみたのだけど,実行時間に変化が2%程度しか無い.

で,よくよく測定してみると 320MB/s 程度の速度でしかデータを読みに行っていないらしい.単位要素あたりの計算が重すぎてメモリのアクセス速度が問題にならないという状況.

とりあえずsqrtを使いまくっている部分をどうにか排除したい気分.確か平方根なしバージョンがあるとか聞いたような気がするのでちょいと調べよう.

元のプログラムに勝つ

ガーッと6時間くらい連続でプログラムを書いて午前のミーティング前にデバッグもほぼ終了.昼に最後のバグ取りをして完成.

とりあえず,共有メモリなマシン上のMPIで動かして,元のOpenMPのプログラムに比べて数%速い程度の性能になった.バリア同期を全く使わずにバトンの受け渡しのみで全体を動かしていることと,各プロセッサの走る領域が固定なのでキャッシュ効率が高くなってたりすることのメリットがMPIのオーバヘッドを上回ったか? とりあえず24コアで16倍を超えるので満足した.巨大なクラスタで試してみたいけれど使えるクラスタが生きてねぇ……

さらなるチューンとしては,次のプロセッサへのバトン渡しを複数回分まとめて行うようにして,さらに複数回の走査を細切れに折返して進めるようにして1次キャッシュを有効利用する…… とかやると速くなるかなぁ.試してみないとわからんけど速くなったら楽しいな.

閑話休題.

でもなぁ,この計算ってどんだけ需要があるのかよく分からないという問題が…… 今回のを似たような計算に応用できるといいなぁ.

«Prev || 1 | 2 | 3 |...| 857 | 858 | 859 |...| 1337 | 1338 | 1339 || Next»
Search
Feeds

Page Top