6月 28

MeCab(和布蕪)とは

公式ページのお言葉を借りると。

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSenJumanKAKASIより高速に動作します. ちなみに和布蕪(めかぶ)は, 作者の好物です.

です。はい。今回は自動でiTunesのふりがなを補完したいためにインストールしました。

MeCab本体のインストール

公式サイトからソースをダウンロードしてきます。今回は「mecab-0.98pre3.tar.gz」を利用しました。

解凍したらターミナルを起動し、cdコマンドで解凍したフォルダに移動します。

で、あとは普通にconfigure、make、そしてsudo make install。


$ cd ~/Download/mecab-0.98pre3
$ ./configure
$ make
$ sudo make install

そうすると、mecabというコマンドが使えるようになるはずです。まだ辞書が登録されていないので形態素解析はできませんが、バージョンを確認してみましょう。


$ mecab --version
mecab of 0.98pre3

正しくインストールできてそうです。

辞書のインストール

次に辞書をインストールします。公式サイトで推奨とされているIPA 辞書をインストールしてみます。「mecab-ipadic-2.7.0-20070801.tar.gz」を今回は利用しました。本体と同じく解凍してターミナルからcdコマンドで解凍したディレクトリに移動します。
本体と同じくconfigure、makeなのですが、文字コードをUTF8にしたいのでconfigureにオプションを付けます。installはいりません。


$ ./configure --with-charset=utf8
$ make

試してみる

インストールできたので形態素解析を試してみます。

形態素解析

$ mecab
すもももももももものうち    //解析したい文を入力してEnter
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

よみがな

$mecab -Oyomi
日本語は難しい。    //解析したい文を入力してEnter
ニホンゴハムズカシイ。

できてます。

コマンドラインで一気に解析する場合は例えば次のようにすればできます。シェルスクリプト等で結果を利用するのに便利かも。

$ echo "引数で文は渡せないのでパイプで渡す" | mecab -Oyomi

MeCabの利用法等は他のサイト等でいろいろ紹介されていますのでそちらを参考にしてください。

written by chibiegg

トラックバックURL : http://blog.chibiegg.net/2009/06/28_23_340.htm/trackback
5月 29

せっかくビデオを作ったのでYouTubeにアップロードしてみました。

iMovieで制作したのでメニューから一発でYouTubeに投稿したためとっても手軽でした。

今回は説明なしということで…

ラッチ付きシフトレジスタ(74HC595)の実験

JMRIとPythonとセンサーで自動運転

ポイントデコーダの試作

written by chibiegg

トラックバックURL : http://blog.chibiegg.net/2009/05/29_00_297.htm/trackback
1月 15

2009年8月31日追記:Snow Leopardでは動作速度改善と軽量化のためかnibファイルがコンパイルされてしまっているため編集できません。よって現在のところ以下の方法ではフルスクリーンを有効にすることができません。新しい方法がわかり次第掲載します。

画面共有改変方法どうやら10.5.5以降での画面共有は以前の方法では隠し機能が出ないようです。
当方でも最近できていなかったのですが、コメントをいただいて固有の問題ではないのだと知り調べてみました。

こちらで情報を見つけたので日本語で説明していきます。
どうやら2つの方法が有るようで。
一つは簡単だが、セキュリティーに問題があるかも知れない方法
もう一つは複雑だが、安全だと思われる方法。おすすめ。

後者の方法はビデオによる解説も載せておきました。説明文は下にあります。

続きを読む »

written by chibiegg

トラックバックURL : http://blog.chibiegg.net/2009/01/15_21_223.htm/trackback
8月 29

ちょっと夜の間にGCCコンパイルをさせとこうと思ってMacbook Proにmake作業をさせていると、余りもあついので温度をはかってみるとなんと92℃もありました。
最近すこしづつ温度が上がっているような気はしていたのですが90℃を超えたのは初めてです。
明日Appleコールセンターに大丈夫なのか電話して聞いてみよう…

written by chibiegg

トラックバックURL : http://blog.chibiegg.net/2008/08/29_00_196.htm/trackback
3月 26

検証というほど大それたものではありませんが。
教えて頂いたCJKパッチを当てたnetatalkをインストール済みのDebianにLeopardからAFP経由でrsyncを使ってiTunesフォルダをバックアップしてみました。

SSH経由でバックアップしたときはファイル名によってMac側から開けないファイルがあったのですが、そのような現象はありませんでした。

これで安心してiTunesのバックアップがとれます。
CJKパッチやCoreFoundationによるdecompose/precomposeの変換についてもご丁寧に教えでくださったHATさんには自サイト上で申し訳ありませんが、お礼申し上げます。

written by chibiegg

トラックバックURL : http://blog.chibiegg.net/2008/03/26_18_134.htm/trackback