- 2014-11-07 (Fri) 22:46
- 一般
Hadoop で,Reducer が Context に key-value ペアを write したらそのペアがそのまま同じラウンドの Reducer の入力として入ってくる(ループする?)とかいう現象に悩んだ.わけがわからない.謎.
あと,空白区切りで数字を並べた文字列を Mapper から Reducer に送っていたのだけど,Reducer 側で StringTokenizer に食わせるとトークン数が減るとかいう現象にも悩んだ.StringTokenizer に食わせずにそのまま出力すると確かに元の空白区切りの数字達の文字列なのだけど,nextToken と叫ぶといつの間にかひとつくらい数字が消えてる.String.substring でも行方不明の文字が出たりする.謎.
そんなんで4時間位潰したけれど原因がよく分からず.寝る.
結論:とりあえず Combiner に Reducer のクラスを指定しているのを発見.これで Reducer が2段になってて変になっていたと.トークンの消費も2倍なので数が合わなくなると.誰だそんなプログラムを書いたのは.
- Newer: ことはじめ