トリビア

Google N-gram コーパスを丸ごとトライにすると,ノード数は 150 億程度になります.LOUDS を用いて表現した場合の想定サイズは約 22GB です.メモリ上に展開することも,不可能ではありません.

※ バイト(Byte)を文字として扱いました.LOUDS 利用時の想定サイズは 11.75 bits/node で計算しています.なお,日本語版・英語版ともにノード数は 150 億程度になります.