でじくる。

主にプログラムの話題などを扱うブログです。

Apache Solrで形態素解析をしたいときはlucene-gosenを使うという話

Apache Solrという全文検索エンジンがあります。

Javaで作られていて、PHPなんかからも簡単に扱えるので便利。

 

多国語対応する場合はn-gramが楽なのですが、

日本語しか使わない場合はまあ、形態素解析にしたいですよね。

 

ということで、「Apache Solr入門」を参考に

Senを導入しようとしたんですが、これがちゃんと動かない。

 

どうも、今はlucene-gosenというのがあって、それを使うんですね。

 

Apache Solr入門」のサンプルのlucene-gosen対応(1章から4章)

http://johtani.jugem.jp/?eid=44

 

lucene用のライブラリということで、非常にお手軽です。