2011-02-01から1ヶ月間の記事一覧

marisa-trie の更新

ちまちまと更新しました.バージョンは 0.1.3 になっています.辞書のフォーマットが 0.1.1 から変化しているため,再構築が必要になります. marisa-trie - Project Hosting on Google Code http://code.google.com/p/marisa-trie/ 0.1.0 と 0.1.3 を比べる…

marisa-trie の高速化と実験結果(続き)

概要 昨日の実験結果(marisa-trie の高速化と実験結果 - やた@はてな日記)では索引のサイズを変更した結果を表にしていたわけですが,索引のサイズ以外にも変更した部分があったため,その部分のみを適用した結果を調べてみました. 変更箇所 select() の…

marisa-trie の高速化と実験結果

Version 0.1.0 と Version 0.1.1 の検索時間を比較するついでに,索引の実装を少し修正したもの(Version 0.x.x)もまとめて比較してみました.Version 0.x.x については,索引のサイズが約 2 倍になったことにより,辞書のサイズが 2-4% 大きくなっています…

marisa-trie 0.1.1 を公開(高速化)

marisa-trie の実装を見直して,無駄に rank() を呼び出している箇所があったので修正しました.その結果,検索速度が向上しています.データ構造やインタフェースの変更はありません. marisa-trie - Project Hosting on Google Code http://code.google.co…

どこへ行くにも遠くて困る

IPSJ の全国大会と NLP の年次大会に参加予定ということで,宿泊施設の確保と交通費の概算をしながら,交通費の高さに嘆いていました. 往路:徳島→東京 徳島から東京への移動については飛行機を使います.普通運賃では 29,600 円になりますが,スーパー旅割…

darts-clone 0.32g rc1 → darts-clone 0.32g

特に問題なさそうなので,正式版(0.32g)ということにしました.変更箇所は,README, COPYING の更新にコメントの修正のみです. darts-clone - Project Hosting on Google Code http://code.google.com/p/darts-clone/ # 正式版にするのを忘れていました.…

雨とプロセッサ

体調が戻りました ほとんどの症状は解消しました.鼻詰まりが残っているものの,行動には特に問題なしです.とはいえ,天候の方は下り坂,気温も低くなっているので,また体調を崩してしまわないように気をつけなくては…. プロセッサを支える技術 残り プロ…

頭がボーッとして働きません

昨日から風邪気味で,本を読んでもまったく頭に入ってこないので,MARISA を略称とするようなフレーズを考えて時間を潰していました.思い付いたのが以下のフレーズです. MARISA: Matching Algorithm with Recursively Implemented StorAge これだけ見ても…

プロセッサを支える技術 第 2 章

第 2 章は「プロセッサの変遷」です. コンピュータ以前 まずはコンピュータ以前の計算装置ということで,そろばんの説明から始まっています.とあるゲームでは武器として使われていましたが,計算の道具として馴染み深い存在です*1.むしろ,最近のいわゆる…

陽気です

言語処理学会の論文〆切前後から少し放置状態になっていた RSS Reader を片付けるべく,いろいろヴァーッと読んでいました.後,言語処理学会第17回年次大会(NLP2011)ワークショップ 「自然言語処理における企業と大学と学生の関係」 の原稿もヴァーッと読ん…

情報処理学会会誌 1 月号

どうも届いて半月くらい寝かせた後で読むのが習慣化しつつあります.# 私が書いている部分は,なんとなく思ったことばかりで,ほとんど根拠なしです. 座談会 情報系学長,おおいに語る 学長という視点を持つ方々による座談会(2010 年 8 月)の内容で,とこ…

情報セキュリティの日

2 月 2 日は情報セキュリティの日だそうです.特に思うところがあるわけでもないけれど,何となく書かなければならないような気がしました….

marisa-trie の解説まとめ

どのような読者を想定しているのか甚だ疑問な連載と化していましたが,とりあえず,今までの記事をまとめておきます. marisa-trie における rank/select の実装 http://d.hatena.ne.jp/s-yata/20110118/1295288559 rank/select の索引については,ブロック…

幅優先/深さ優先探索による Predictive Search

本日の内容は Predictive Search の実装についてです. 概要 marisa-trie には Predictive Search 用の関数が 3 種類あります. predict() キーの復元をおこなうときは predict_depth_first() を呼び出し,そうでないときは predict_breadth_fist() を呼び出…