Home > Archives > 2008年02月

2008年02月

C#久々続き

AnkhSVN でファイルの名前変更とかプロジェクトの追加とかがうまく動かない… ファイル追加だけは手動でやったほうが速いのかもしれない.

それはさておき,スレッドの動きを UI に表示するために Control.Invoke を使っていたら,Form の Dispose 時にフリーズする現象に遭遇.Dispose 中に Invoke よばれる可能性があるのが悪いような気もするけど… ロックと条件判定入れたけどうまくいかないので結局 BeginInvoke で非同期処理にしてお茶を濁す.EndInvoke も呼んでやらない.

C#久々

ThreadPool があると聞いていたので試した.でもスレッドを全部待つ wait がない.タスクすべての終了を待つような用途は想定していないというか,そもそも .NET 側の非同期系の操作でも使われるらしいのでユーザが明示的に登録したタスクだけを全部待つってのが無理なのか? とりあえず自前で各スレッドの終了時に処理を書くか,そもそも自前のプールを用意するかすべきなのかも.

うーん面倒だなぁ

この前仮想ハードディスクごと書き途中のソースを削除するとかいうあほなことをしてしまったので,VMware 中の Linux にあるソースを Vista (ホストOS) 上の svn リポジトリで管理したい.外部のサーバにおいてもいいけどネットワークが切れているときに困る.

で,ホストにsshd入れるのがめんどい.そしてホスト側のIPをゲスト側が知るにはどうすればいいか考えるのが面倒.VMware のネットワークドライバのIPって固定なのかな? そうなら問題ないのだけど.

sedでmerge sortをしてみる

入力は空白区切りの小文字のみで構成される文字列のリスト.出力はソート結果.あなごるのWord frequency count (FIXED) 用に作ったのだが… 問題の入力に出てくる単語のソートだけで手元のマシンでも6秒弱かかる.

# input: word1 word2 ... wordn
# should be lower-case letters. no spaces except for the separator
 
 
s/ /\n/g
s/$/ /gm
 
# each line is a sorted list
 
:a
 
/\n/!q
 
s/^\(.*\)\n\(.*\)$/@\1: %\2/gm
 
# each line: @word11 word12 ... word1n : %word21 word22 ... word2m
# ':' is a separator of two lists
# '@' is the head of non-merged part of the first list
# '%' is the head of non-merged part of the second list
 
 
:b
 
# each line: sortedpart @word1i ... word1n : %word2j ... word2m
 
s/^[^%@:\n]*$/~&/gm                  # already done 
s/^\(.*\)@\(.*\): % *$/~\1\2/gm      # done (2nd list is consumed completely)
s/^\(.*\)@: \(.*\)%\(.*\)/~\1\2\3/gm # done (1st list is consumed completely)
 
/@/!be
h
 
s/^~.*$/~/gm                          # ignore merged lists
s/^.*@\(\w*\).*%\(\w*\).*$/\1 \2/gm  # prepare to comparation
 
 
#------------------- parallel comparation -----
 
# input: word11 word12\nword21 word22\n...\nwordn1 wordn2
# should be lower-case letters. no spaces except for the separator
# the entry '~' is ignored
 
# algorithm:
#   make pairs of corresponding characters in two words
#   compare all pairs at the same time
#   take the first non-equal result of he comparisons
 
 
s/^\| /&#/gm
s/^#~ *$/~/gm
 
:5
s/#\(\w\)\(.*\)#\(\w\)/\1\3 #\2#/mg
s/#\w.*#$/>/mg
s/# #..*/</mg
s/# #$/=/mg
t5
 
:1
 
:2
/a/b9
y/bcdefghijklmnopqrstuvwxyz/abcdefghijklmnopqrstuvwxy/
b2
:9
 
s/a[^a] /</g
s/[^a]a />/g
s/aa /=/g
 
/[^\n=<>~]/b1
s/^=*\(.\)/\1/gm
s/^\(.\).*/\1/gm
 
#----------- parallel comparation done ------
 
s/\n//g
s/$/#/
G
 
# [<>=]*#\nmergedpart @rest_of_list1 %rest_of_list2\n... 
 
# according to the results of comparations held in the head,
# move a head of either the rest of list1 or list2 to the tail of merged_part.
 
 
:m
s/^[<=]\(.*\)\n\(.*\)@\(\w*\) \(.*\)%\(\w*\)/\1-\2\3 @\4%\5/m
s/^>\(.*\)\n\(.*\)@\(\w*\)\(.*\)%\(\w*\) /\1-\2\5 @\3\4%/m
s/^~\([^\n]*\)\n~/\1-/
tm
s/-/\n/g
s/#\n//
bb
 
:e
s/~//g
ba

一文字目でバケットソートしてマージソートを各バケットに適用とかしないとダメっぽい.とにかく操作文字列長を小さくしないと速度が…

むしゃくしゃしてやった.sedならなんでもよかった.今は反省している.

数日前,あなごるのLanguage RankingでsedがTop10外になっているのを見たとき,今回の反攻を思いついた.

なんとなく手の届きそうなところに bash と C がいたので,とりあえず手付かずだった問題を10問強ほど sumit してこいつらを追い越してみた.ほとんどの問題が sed では計算のしようのない問題で embed 中心.だけど,たまにまともなアルゴリズム(?)でといたのもある.reverse entire input は最後の改行だけずるするとか.Permutations は全部のpermutationをまじめに生成するとTLE食らうので,最初の二文字だけは別生成させた上で残りの4文字文をまじめに生成するハイブリッドなアルゴリズムとか.(今のpermutation生成部は打数削減のために遅くなっていて,そのせいでへんなことをする羽目になっている.なので,打数を余計に消費してでも高速なアルゴリズムに切り換えれば全体の打数を小さく出来るかもしれない.)

あとは123 とか解けるといいんだけどなぁ.sedのファイル読み込みは読み込んだ文字列の加工が出来ないから難しい.どこかに 1 2 3 の値をランダムにとるファイル落ちてねえかなぁ?

追記:permutation生成部を高速化したら生成部それ自身が縮んだ.なのでPermutationsのサイズがかなり小さくなった.ついでに permutator のほうも 9B 縮んだ.やっぱ m オプション便利だわ.

追記の追記:さらに縮んだ.結局最初の permutator から 22B 減少.

Home > Archives > 2008年02月

Search
Feeds

Page Top