2^n で割ったあまりを求めるには 2^n -1 との AND をとる方が一般には速い.んで,コンパイラもそこらへんがわかっているので AND 演算に置き換えてくれるのだが… 以下の二つのプログラム
int main(int argc, char *argv[]) { int k = 0; for(int i = 0; i < 100000000; i++){ k = k % 4; } return k; }
と
int main(int argc, char *argv[]) { int k = 0; for(int i = 0; i < 100000000; i++){ k = k % 4U; } return k; }
では後者のほうが3倍くらい速くなる(倍率は環境によるかもしれないけど).両者のアセンブリコードを比べると
xorl %edx, %edx movl $99999999, %ecx jmp L6 .p2align 4,,7 L5: andl $-4, %eax subl %eax, %edx decl %ecx movl %edx, %eax js L10 L6: testl %edx, %edx movl %edx, %eax jns L5 leal 3(%edx), %eax andl $-4, %eax subl %eax, %edx decl %ecx movl %edx, %eax jns L6 L10: leave ret
と
xorl %ecx, %ecx movl $99999999, %edx .p2align 4,,15 L5: movl %ecx, %eax andl $3, %eax decl %edx movl %eax, %ecx jns L5 leave ret
のようになっており(gcc3.4.4),後者のほうが分岐が無いし速いのは当たり前.とりあえず問題点は「符号付の剰余は負数のときにめんどくさい」という点にある.その面倒な処理が分岐を必要として遅くなってしまうと.
ということで,負数なんて知らんという場合には明示的に符号なしであることを指定しておくべし.
- Newer: AWK - はじめ