No Such Blog or Diary
Home > Archives > 2012年02月02日
ちょっとループを変形して自分でベクタライズしてSSEが刺さるようにしてみたら計算時間が3/4位には縮まった.まあ,SSEでは double 2つ分しか並列化されないのでこんなもんか.AVXが使えればもう一声速くなるか?
とりあえず強制パイプライン化による加速パラメータの劣化が結構痛いのでちょっとストールが入ってしまうけれど別の並列化を導入しよう.ただの趣味なので査読に飽きたら処理する.
Page Top