- 2012-10-09 (Tue) 23:51
- 一般
ほんのちょっと外側に単純なループを追加しただけで mulps とかが mulss とかになってしまう.中でやっている変換の仕様を見たほうがはやいかなとか思い始めた.
あとはレジスタ余ってるのに直前に読んだメモリをレジスタに置いとくとかしてくれないのね…… そのオフセットの値はひとつ前のイテレーションで読んでるじゃん,とか文句を言いながらどうしたもんかと1日悩む.結局解決法はわからん.Expression templates で計算式を持ってきているので手動で register と叫ぶことができず,コンパイラに頑張ってもらうしかないのだけど…… ああ,マイナス方向のインデックスへのアクセスを拾ってきて明示的にキャッシュしておいた値を返すように式を変換してしまえばいいのか.問題はそれをやったとしてベクタライザがうまく動いてくれるかだな.
コンパイラに言う事をきかせるのは難しい.
- Newer: ことはじめ