何度目か忘れた MeCab のインストール

今までに何度も MeCab をインストールしてきたけど,その度にダウンロード URL を調べたり,どんなオプションが必要だったのかを調べ直したりするのが面倒なので,次からは楽ができるようにメモを残すことにしました.

とりあえず,g++ が必要なのでインストールします.

# Debian 系なら aptitude です.古い環境では apt-get になると思います.
$ sudo aptitude install g++

# Red Hat 系なら yum ですね.あんまり使ったことがありませんけど….
$ sudo yum install gcc-c++

Python からの利用を考えているのであれば,Python 用の開発環境が必要になります.環境によって微妙にパッケージの名前が異なるので,環境が変わると苦労します.

# Debian 系なら python-dev っぽいです.
$ sudo aptitude install python-dev

# Red Hat 系では python-devel っぽいです.
$ sudo yum install python-devel

それでは,MeCab をダウンロードしてインストールします.UTF-8 以外を使う気がないので --enable-utf8-only を付けています.make check については,環境によって失敗することがあります.失敗するのが run-cost-train.sh のみであれば,形態素解析をおこなうのには問題ないと思います.

wget http://sourceforge.net/projects/mecab/files/mecab/0.98/mecab-0.98.tar.gz
tar zxf mecab-0.98.tar.gz
cd mecab-0.98/
./configure --enable-utf8-only
make
make check
sudo make install
sudo ldconfig
cd ..

環境によっては,sudo ldconfig の前に,/etc/ld.so.conf に一筆必要になります.Ubuntu 10.04 では不要でしたが,Fedore Core 8 では必要でした.一応,中身を確認してから編集しましょう.

$ sudo vi /etc/ld.so.conf
/usr/local/lib

次は,辞書をインストールします.UTF-8 以外を使う気がないので --with-charset=utf8 を付けています./etc/ld.so.conf の編集が必要な環境では,ここで失敗することがあります.

wget http://sourceforge.net/projects/mecab/files/mecab-ipadic/2.7.0-20070801/mecab-ipadic-2.7.0-20070801.tar.gz
tar zxf mecab-ipadic-2.7.0-20070801.tar.gz
cd mecab-ipadic-2.7.0-20070801/
./configure --with-charset=utf8
make
sudo make install
cd ..

後は,必要に応じて Python バインディングをインストールします.Amazon EC2Fedora Core 8 上では,最後の setup.py install について,sudo を付けると失敗してしまいました.そもそも root でログインしていたので,sudo なしでやってみると,無事にインストールできました.

wget http://sourceforge.net/projects/mecab/files/mecab-python/0.98/mecab-python-0.98.tar.gz
tar zxf mecab-python-0.98.tar.gz
cd mecab-python-0.98/
python setup.py build
sudo python setup.py install
cd ..

以上です.

追記(2010-11-02):make check の失敗に関する部分を修正しました.32-bit 環境でも失敗することがあるようです.でも,run-cost-train.sh という名前からすると,IPAdic を使った形態素解析には影響しなさそうです.