2009-07-01から1ヶ月間の記事一覧
dawgdic::DawgBuilder と dawgdic::Dawg のメンバ関数 num_of_merged_states() を修正しました.以前は併合された「遷移の数」を返すようになっていたのを,「状態の数」を返すようになっています.また,「遷移の数」を返すためのメンバ関数 num_of_merged_…
日本語版・英語版それぞれ 3, 4 時間くらいで索引を構築できました.ただし,RAID 0 にして HDD アクセスを高速化していたり,一時ファイルの保存先が SSD だったりというドーピングがあるので,一般的な環境では,もっと少しかかるでしょう.とはいえ,一日…
とりあえずアップロードしましたが,ドキュメントがないので使い方が謎の状態です. ssgnc - Google Code http://code.google.com/p/ssgnc/ 追記(2009-07-10):CGI 用の perl script でパラメータが反映されないバグを修正.追記(2009-07-10):正しい検…
darts-clone 0.32f を公開しました. darts-clone - Google Code http://code.google.com/p/darts-clone/ 結局,中身が dawgdic になってしまいました.利用には dawgdic-0.30 以降が必要になります.一応,ChaSen 2.4.4 および MeCab 0.98pre3 にて,darts.…
文字コード判定プログラムを作成してみました. mojicode-0.1.0.tar.gz http://sites.google.com/site/headdythehero/cabine/2009/0703/mojicode-0.1.0.tar.gz?attredirects=0 デフォルトでは,ひらがなとカタカナだけを見て文字コードを判定します.最初に …