入力補完・再び

Google n-gram を使っての入力補完を英語版のコーパス全体に適用してみました.単体で約 2GB の辞書が 30 個以上で,すべての辞書を合計すると約 70GB になりました.さすがに,最初の入力についてはディスクアクセスのため数秒待たされますが,以降はそれなりの時間で応答が返ってくるようになります.

# SSD が使えると,もっとレスポンスが良くなることでしょう.

追記(2009-09-07):日本語版の辞書を構築してみたところ,サイズは約 73GB になりました.英語版の約 72GB と比べると,少しだけ大きくなっています.