2009-07-01から1ヶ月間の記事一覧

dawgdic-0.3.1

dawgdic::DawgBuilder と dawgdic::Dawg のメンバ関数 num_of_merged_states() を修正しました.以前は併合された「遷移の数」を返すようになっていたのを,「状態の数」を返すようになっています.また,「遷移の数」を返すためのメンバ関数 num_of_merged_…

ssgnc-0.2.0 による索引の構築時間とサイズ(メモ)

日本語版・英語版それぞれ 3, 4 時間くらいで索引を構築できました.ただし,RAID 0 にして HDD アクセスを高速化していたり,一時ファイルの保存先が SSD だったりというドーピングがあるので,一般的な環境では,もっと少しかかるでしょう.とはいえ,一日…

ssgnc-0.2.0

とりあえずアップロードしましたが,ドキュメントがないので使い方が謎の状態です. ssgnc - Google Code http://code.google.com/p/ssgnc/ 追記(2009-07-10):CGI 用の perl script でパラメータが反映されないバグを修正.追記(2009-07-10):正しい検…

Darts-clone 0.32f(dawgdic 依存)

darts-clone 0.32f を公開しました. darts-clone - Google Code http://code.google.com/p/darts-clone/ 結局,中身が dawgdic になってしまいました.利用には dawgdic-0.30 以降が必要になります.一応,ChaSen 2.4.4 および MeCab 0.98pre3 にて,darts.…

文字コード判定プログラム

文字コード判定プログラムを作成してみました. mojicode-0.1.0.tar.gz http://sites.google.com/site/headdythehero/cabine/2009/0703/mojicode-0.1.0.tar.gz?attredirects=0 デフォルトでは,ひらがなとカタカナだけを見て文字コードを判定します.最初に …