ssgnc の改修
何ヶ月か前に改修中と宣言してから放ったらかしになっていたのですが,再開することにしました.
# 符号化方式の変更を検討したり,インタフェースを検討したり,ライブラリの依存関係について検討したり,いろいろとやっている間に忙しくなって,その内に N-gram コーパスが使えなくなり,という流れで放置状態に至ったというのが真相です.
再開した理由は,自前の N-gram コーパスが用意できたことと,32-bit 環境で使いたくなったからです.
今回の改修では,32-bit 環境でも動くようにすることと,ファイルのサイズを 2GiB 未満に抑えることも要件に加えたので,構築・検索のどちらも大幅に変更となる予定です.いわゆる,作り直し的な何か….