Google n-gram 検索システム

使えるレベルになったような気がします.インデックス自体には特定の 1-gram を含む n-gram を頻度降順に返す機能しかありませんが,それでも役に立つと思います.

  • できることの例
    • 「りんご」と「みかん」が出現する n-gram の列挙
    • 「りんご」と「みかん」が順番に出現する n-gram の列挙
    • 「りんご」と「みかん」が続けて出現する n-gram の列挙
    • 「 * * の よう な * * 」('*' は任意の 1-gram)に一致する n-gram の列挙

今月末(2009/3/31)には公開できそうな状態です.