2011-04-01から1ヶ月間の記事一覧

marisa-0.2.0-beta4 の公開

marisa-0.2.0-beta3 のバグを修正したものを marisa-0.2.0-beta4 としました. プロジェクト http://code.google.com/p/marisa-trie/ ドキュメント http://marisa-trie.googlecode.com/svn/trunk/docs/readme.ja.html 変更点は以下のとおりです. Trie::mmap…

marisa-0.2.0-beta3 の公開と技術的なお話

先日の記事(検索時間が短くなりました - やた@はてな日記)で述べたように,キャッシュの導入によって検索の高速化を実現しました.思い付いた時点ではブレイクスルーになると考えていたものですが,今となっては当たり前のアイデアのように感じてしまいま…

検索時間が短くなりました

辞書に対してキャッシュを埋め込むことにより,検索時間の短縮に成功しました. 概要 基本的な考え方は,到達確率の高いノードについて,遷移に必要な情報をダイレクトマップ方式で保存しておくというものです.到達確率については,辞書を構築するときに計…

辞書の構築時間が短くなりました

std::sort() を使って文字列(バイト列)を整列していたところをマルチキークイックソートに切り替えたことにより,辞書の構築時間が 15-25% くらい短くなりました.アーカイブの方はまだですが,Subversion には更新版のソースコードをコミットしてあります…

marisa-0.2.0-beta2 に更新

Mac OS にてテストプログラムをコンパイルできないという問題が見つかったので,修正したものを marisa-0.2.0-beta2 として公開しました. プロジェクト http://code.google.com/p/marisa-trie/ ソースコード http://marisa-trie.googlecode.com/files/maris…

市民メダルが金になっていました

いつの間にか,ユーザー登録から本日までに日記をつけた日数が 300 日を超えていました.http://www.hatena.ne.jp/help/citizen次なるプラチナは 1000 日ということで,無理っぽいです.

marisa-0.1 系と marisa-0.2 系の違いをまとめてみる

# 書いている途中で寝てしまったので,一日遅れでお送りしています.LOUDS ベースの Patricia Trie を入れ子にするというコンセプトで開発された marisa-0.1 系と marisa-0.2 系ですが,インタフェースが大きく異なるという目に見える違いの他にも,いくつか…

marisa-trie のリポジトリを更新

ドキュメントを用意できたので,リポジトリの内容を marisa-0.2.0-beta に差し替えました.念のため,パッケージについては,いくつか他の環境で試してからアップロードする予定です. プロジェクト http://code.google.com/p/marisa-trie/ marisa-0.2.0-bet…

次期 marisa-trie のインタフェースに関するメモ

ほとんどの部分を作り直すという暴挙によって仕上がった代物を,近い内に marisa-0.2.0-beta として公開する予定です.旧版(marisa-0.1.x)と比べると,最大の違いはインタフェースです.原形が残っていないので,旧版を利用するソースコードの流用は無理で…

marisa-trie の小さな更新

marisa-0.1.3 に少し修正を施したものを marisa-0.1.4 として公開しました. http://code.google.com/p/marisa-trie/ 今回の修正は,以前に報告されていた問題への対処になっています.基本的な動作やインタフェース,辞書のフォーマットには変更ありません…