Mac OSX LeopardにMeCabをインストール

MeCab(和布蕪)とは

公式ページのお言葉を借りると。

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです. 言語, 辞書,コーパスに依存しない汎用的な設計を 基本方針としています. パラメータの推定に Conditional Random Fields (CRF) を用 いており, ChaSenが採用している 隠れマルコフモデルに比べ性能が向上しています。また、平均的に ChaSenJumanKAKASIより高速に動作します. ちなみに和布蕪(めかぶ)は, 作者の好物です.

です。はい。今回は自動でiTunesのふりがなを補完したいためにインストールしました。

MeCab本体のインストール

公式サイトからソースをダウンロードしてきます。今回は「mecab-0.98pre3.tar.gz」を利用しました。

解凍したらターミナルを起動し、cdコマンドで解凍したフォルダに移動します。

で、あとは普通にconfigure、make、そしてsudo make install。


$ cd ~/Download/mecab-0.98pre3
$ ./configure
$ make
$ sudo make install

そうすると、mecabというコマンドが使えるようになるはずです。まだ辞書が登録されていないので形態素解析はできませんが、バージョンを確認してみましょう。


$ mecab --version
mecab of 0.98pre3

正しくインストールできてそうです。

辞書のインストール

次に辞書をインストールします。公式サイトで推奨とされているIPA 辞書をインストールしてみます。「mecab-ipadic-2.7.0-20070801.tar.gz」を今回は利用しました。本体と同じく解凍してターミナルからcdコマンドで解凍したディレクトリに移動します。
本体と同じくconfigure、makeなのですが、文字コードをUTF8にしたいのでconfigureにオプションを付けます。installはいりません。


$ ./configure --with-charset=utf8
$ make

試してみる

インストールできたので形態素解析を試してみます。

形態素解析

$ mecab
すもももももももものうち    //解析したい文を入力してEnter
すもも 名詞,一般,*,*,*,*,すもも,スモモ,スモモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
も 助詞,係助詞,*,*,*,*,も,モ,モ
もも 名詞,一般,*,*,*,*,もも,モモ,モモ
の 助詞,連体化,*,*,*,*,の,ノ,ノ
うち 名詞,非自立,副詞可能,*,*,*,うち,ウチ,ウチ
EOS

よみがな

$mecab -Oyomi
日本語は難しい。    //解析したい文を入力してEnter
ニホンゴハムズカシイ。

できてます。

コマンドラインで一気に解析する場合は例えば次のようにすればできます。シェルスクリプト等で結果を利用するのに便利かも。

$ echo "引数で文は渡せないのでパイプで渡す" | mecab -Oyomi

MeCabの利用法等は他のサイト等でいろいろ紹介されていますのでそちらを参考にしてください。

Safari4のおかげ?

今月は急激にアクセス数が増加しています。
今月のグラフがすごいことに…

2009年6月の日別アクセス数(26日時点)

2009年6月の日別アクセス数(26日時点)

9日から急激に増えているのがわかると思います。
ページ別のアクセス数を確認すると、Leopard発売時の「Leopardの「SIMBL」「SafariStand」」という記事のアクセス数が急増していました。

特定記事のアクセス解析

特定記事のアクセス解析

Safari4非対応のSafariStandがインストールされていると正しく動作しない場合があるようです。以前の記事にも追記しましたが新しいSafariStandのプラグインファイルを過去のプラグインと交換するだけで動作します。SIMBLには一切触れませんでした。

この小さなサイトだけで断言はできませんが、Safari4は多くの方が利用しているのだなぁと、おかげでもうすぐユニークアクセス数(訪問した人数、延べではない)が後少しで30000人に届きそう。

で、なんでみなさん「SafariStand アンインストール」で検索して来られるのでしょうか。アップデートすれば問題ありませんから、便利なのでアンインストールしないでくださいね〜

暑い!

サーバーもMacに変えた時にサーバーの設置場所をリビングから自室にしたのですが、サーバールームになったとたん暑いのなんのって…一昔前に放送されてたIBMのCMが事実であることを実感します。このCMなんですが…
冬は寒くなくていいなぁと思ってたんですが。

読み込み中…

//

それにしてもMacProは放熱対策はばっちりみたいなので、内部の温度は室温と大差ないのがすごい。以前つかってたサーバー機(普通の自作機)が熱で痛んだ理由がよくわかります。

まぁそのサーバー機は現在唯一のWindows機で開発用につかっているのですが、サーバーとして使えるほどは安定してません。

で、問題はこれから夏本番に入っていくのにどうするのか!

定期的にエアコンを自動操作するリモコンをつくるかな…

基板到着

2週間ちょっと前にOLIMEXに発注した基板が到着しました。
OLIMEXを利用するようになってからもう何年か立ちますが、こんなに頼んだのは初めてです。

3パックに包まれてやってきました。
pcb_1

開封し、種類別に分けるとこんな感じ。
pcb_2

 

中身は

DCC関係

  • シグナルデコーダ
  • ポイントデコーダ
  • 赤外線トランスポンダ受信ボード
  • ファンクションデコーダ
  • モーター車用デコーダ
  • LocoUSB rev.2

その他

  • XBee USB変換基板
  • microSD変換基板
  • JTAGデバッガ
  • I2C接続モータードライバ

 

他には後輩が発注したものです。

製作結果は研究ノートに掲載予定です。

仕入れ 2009年5月29日

先日発注しておいた部品が到着しました。

 

仕入れ1

仕入れ

今回の目玉は、次の5つです。

 

仕入れメイン

仕入れメイン

  • 表面実装ブリッジダイオード 左端
  • AVR ATmega164 DIPとTQFP 左から二番目
  • AVR ATtiny84 QFP 右から3番目のリール
  • 表面実装赤外線受光モジュール(38kHz) 右から二番目
  • 表面実装赤外線LED 一番右

QFPハンダ付けできるかな(笑)
あと、表面実装赤外線受光モジュールは良い収穫かな、レールの間にぴったり。

LocoUSB rev.2 は2個ほど頒布できそうです。
 

あと、後輩の分

parts2

初めてのYouTubeへの投稿

せっかくビデオを作ったのでYouTubeにアップロードしてみました。

iMovieで制作したのでメニューから一発でYouTubeに投稿したためとっても手軽でした。

今回は説明なしということで…

ラッチ付きシフトレジスタ(74HC595)の実験

JMRIとPythonとセンサーで自動運転

ポイントデコーダの試作

ホームページ「chibiegg研究ノート」開設

ブログだけで始めてきましたが、当初の予定でもあったホームページも開設しました。

chibiegg研究ノート:http://www.chibiegg.net/

ブログはほとんどメモのように記事を書いていますが、ホームページの方はもうちょっと纏まりのあるようにがんばります。

もちろんブログも続けていきますし、ノートにまとめるほどは進んでいない内容はブログに追加していきますのでどちらも見ていただけると喜ばしい限りです。

 

ホームページとブログもつくったので、トップページ(http://chibiegg.net/)も作らないとだめですね。まだ双方の移動手段があまりよろしくない点も改善したいと思います。

GCC4.3.3によるARMのクロスコンパイル

前回の記事でGMPとMPFRライブラリはインストールできたので、ARMのGCCクロスコンパイラを導入します。
Interface2008年11月号を参考にしています。
コンパイルディレクトリはソースディレクトリと同一で行うと次のようなエラーがでます。
Makefile:144: ../.././gcc/libgcc.mvars: No such file or directory
make[2]: *** No rule to make target `../.././gcc/libgcc.mvars'. Stop.
make[1]: *** [all-target-libgcc] Error 2
make: *** [all] Error 2

 

Read more …

LeopardにMPFRとGMPのインストール

OSX LeopardにARMクロスコンパイル環境の構築をしようと思い、GCCをインストールしようとしたのですが、MPFRとGMPをインストールするときにてこずったのでメモしておきます。

問題はCPUが64bitだったことでした。
GMPはオプションをつけずconfigureをかけると64bitモードでライブラリが生成されます。しかし、今のところMPFRは64bitに問題があるらしく両方を32bitにしなければいけません。そのときにつけるオプションが”ABI=32″でした。

このオプションをつけずにMPFRのcoufigureをすると、
checking for __gmpz_init in -lgmp... no
configure: error: libgmp not found or uses a different ABI.
Please read the INSTALL file -- see "In case of problem".

とエラーが出てしまいます。
Read more …

MacのMLB交換に伴うTime Machineの不都合

Mac本体の修理によってMLB(メインロジックボード。マザーボードとは言わないんですね。)を交換したり、新しいMacを買ってデータを丸ごと移行することによってMLBがかわった場合のTime Machineの挙動についてです。

今回そのような状態になったのですが、いざバックアップの更新をしようとしても更新されませんでした。環境設定から確認すると「バックアップボリュームが見つかりません。」というエラーが確認できました。

再度Time Machineの設定を行えば違うバックアップを1から作成してくれそうだったのですが、それでは以前との整合がとれないのと容量の無駄遣いなのでどうにかならないかと調べてみました。以下は不都合が起きる原因と対策です。
Read more …