No Such Blog or Diary

«Prev || 1 | 2 | 3 |...| 876 | 877 | 878 |...| 1114 | 1115 | 1116 || Next»

Machine Learning に関するアルゴリズムの MapReduce 実装とか調べた

というか,まんまな論文があったので読んでみた.

結論:GroupByKey演算いらない問題しか扱っていない.バッグ上の準同型(リダクション演算子は加算限定)でしかない.だけど"the summation form"とか名前をつけてしまっている.

この分野でよく扱われている計算10個の並列化の仕方をコメントして(つまりは彼らのいうsummation formがあるよねと言って),実験結果を示しているのだけど,実際にやられていることは非常に単純.データ量が大量にありすぎるだけなので,それを分散して map と sum を並列化したらバンザイ.残りの部分は興味のある特徴量の次元数(データ量に比べて非常に小さい)にしか依存しないから並列化しなくていいよね,と.

著者らも,別に新しい速い並列プログラム(アルゴリズム)つくったわけでなくて簡単に書ける枠組みを考えたんだよ,という言い方をしている.その枠組が新しいか否かはなんともいえないが…

とはいえ,この単純なパタンで書けちゃうけど良く使われる計算10個,というものをまとめたことには大きな価値があるかなと.我々の得意とする並列計算パタンで計算できる重要な計算問題のサーベイの手間が省けるから.

どうでもいいけど K-means に hard と soft があったとは知らんかった.

さて,次はどの辺を調べようか? できればGBK演算が本質である例を見つけたいのだけど…

癖の矯正は新しいことを身につけるより大変

教習車はCB400SFなわけだがKSR-Iに比べるとアホみたいに重い.力技ではどうにもならんということは良くわかった.面倒なので絶対にこかさないことを心に誓う.

そして癖をどうにかするのが課題という.動かすこと自体はあまり問題ないのだが…

癖1:レバーの握りとか.加速して2速に入れたときにクラッチレバーに指を添えたままになってしまう.2速の後には3速が待っている,という頭なのだけど3速に入れるなと指示されとるので指だけ残るという… 4回くらい連続で注意されたので直ってきただろうか? そして4本で握るというのもなかなか慣れない.3本くらいで

癖2:カーブで速度出しすぎらしい.カーブを2速のアクセル全閉で曲がるのに違和感があるのだけど400ccでパワーあるし教習所内なのでそんなんで良いのかもしれない.初回だからかもしれないけれど.

癖3:短い直線だけど3速に入れようとしたり長めの直線で4速入れようとしたり… パワーのない原付の感覚がベースなのでさっさとギア上げたくなるけど400ccならそんなことせんでもエンジン働いてくれるという.

癖4:腕の力でどうにかしようとしてしまう.足で支えろと.手の力抜けと.内腿微妙に痛いかも…

とりあえず他には,右足はとりあえずフットブレーキ踏んどけ,サイドスタンドかけたら左にハンドル切れ,乗り降りとかセンタースタンド外すときには右にハンドル切れ,前に座れ,つーかカーブ手前はエンジンブレーキだけでなく普通のブレーキも使え,右足付くときは後確認しろ,あたりに気をつけなければならない.

そういや1速からニュートラルに入れようとしても2速に入ってしまう現象に悩まされたっけ.力加減がかなりシビアだった気がする.途中からは2速からニュートラルに入れるほうが簡単であることに気づいてそうしてたけれど.

次回は黄色2のゼッケンで.黄色は危険の印.

ランダマイズドな近似アルゴリズムに関する論文は読みにくい

ランダマイズドアルゴリズムや近似アルゴリズムには,平均の計算量とか近似比とかをコントロールする為のパラメータが含まれる.そして,多くの場合,ランダム選択のための確率や条件分岐の条件には,そのパラメータの一見して意味不明な多項式とかが大量に出てくる.基本的にこれらの式の形の複雑さは,計算量とかの保証のために証明上都合の良いしきい値を取っていることに起因する.そのため,アルゴリズム中のパラメータによる判定式が何の目的でその形をしているのかは証明を詳しく追わないと理解出来ない.とどのつまり,直感が働かないのでアルゴリズムの本質がなんなのか一見しただけではわからない(論文の本文中に説明があれば別なのだけど,紙面の都合上,そこまで親切にするのは難しいのでしょう).

ということで,Max-cover を解くためのランダマイズド近似並列アルゴリズムの論文読むのに二日かかった.MapReduce使えるとか言っているのを確かめたかっただけなので,そこまで細かく読む必要はなかったかもしれない.

そしてこいつは GroupByKey によって,「集合→含まれる要素達」という関係と「要素→それを含む集合達」という関係とをスイッチングするのがキモらしい.ということで,こういった視点の切り替えが必要な集合上のアルゴリズムならGBK演算が必要といえそう.他にっどんな問題があるのか良く解らんけど.

とりあえず Set-cover と Weighted Max-cover と BudgetありMax-cover も同じで動くでしょう.Set-cover はもっと単純かもしれんけど.

何かを思い立つ

免許の更新期限まであと2週間.自動二輪の免許を最速で取るのも2週間.やることはひとつ.

ということで,自動二輪の免許を取りに教習所に行くことにした.虹色のとこ.受付のお姉さんに技能予約を無理矢理突っ込んでもらったりして,規定通りに行けば免許の更新が一回で済む予定.さてどうなることやら.

そして,前に使ってたヘルメットは実家に置きっぱなしなので,新しくSHOEIのMultitecを買った(前のはAraiの何か).かぶると丁度良いフィット感なのだけど,まだ新しいせいなのか脱ぐ時に耳たぶが変に引っかかって痛い.そのうち慣れるといいなぁ.

プリンタをエラー状態に追い込む論文

とある論文のPDFをLinuxから印刷しようとしたら,送りつけた色々なPSプリンタがエラー状態に追い込まれて印刷できなかった.Windows側からやったら問題なかったので,Linux側のGhostscriptとかの辺りで何かがおかしかったのかもしれないけど… よくわからん.

梅雨の時期になると溜まるもの

雑誌とダンボール.

濡れた紙とか微妙すぎるので雨降ってるとゴミに出す気になれない.

来週にはゴミに出せるといいなぁ.

«Prev || 1 | 2 | 3 |...| 876 | 877 | 878 |...| 1114 | 1115 | 1116 || Next»
Search
Feeds

Page Top