No Such Blog or Diary
Home > 一般 > LU分解を頑張って速くする
という競争に参加するために頑張ってコードを改良中.元が3.7秒だったのがブロック化とテンポラリ配列の利用とアンローリングと手動パイプライン化で1秒ジャストまで速くなった.
キャッシュを効かせるなどで高速化するのは煮詰まってきたので,ここらで SSE 命令に手を出して倍速を目指そう.似たような環境での昔の記録が 0.5秒強なので,0.4秒台を出せるまで頑張ろう.
Page Top