Home > Archives > 2012年02月02日

2012年02月02日

SSEを使い出す

ちょっとループを変形して自分でベクタライズしてSSEが刺さるようにしてみたら計算時間が3/4位には縮まった.まあ,SSEでは double 2つ分しか並列化されないのでこんなもんか.AVXが使えればもう一声速くなるか?

とりあえず強制パイプライン化による加速パラメータの劣化が結構痛いのでちょっとストールが入ってしまうけれど別の並列化を導入しよう.ただの趣味なので査読に飽きたら処理する.

Home > Archives > 2012年02月02日

Search
Feeds

Page Top