文字 N-gram コーパスも近い内にできる予定

文字 N-gram コーパスの方も明後日までには完成しそうです.でも,明日から 2, 3 日は家を空ける予定なので,公開できるのは休み明けになるかもしれません.

# 今のところ,ココまでマージできています.
# マージが終われば,残るは N による分配と圧縮のみです.
値 引 き 券 を 配    14
値 引 き 券 プ    16
値 引 き 券 プ レ    16
値 引 き 券 プ レ ゼ    16
値 引 き 券 付    17
値 引 き 券 付 き    13
値 引 き 券 使    12
値 引 き 前    833
値 引 き 前 )    41
値 引 き 前 )     12

元データの共有については,他に良い方法も思いつかなかったので,Amazon EBS のスナップショットを限定公開するような形にしようと思っています.でも,Account Number を教えてもらわないといけないところが面倒….というか,そういう情報については,できる限り持ちたくないというのが本音です.うむむ….