Apache Solrという全文検索エンジンがあります。
Javaで作られていて、PHPなんかからも簡単に扱えるので便利。
多国語対応する場合はn-gramが楽なのですが、
日本語しか使わない場合はまあ、形態素解析にしたいですよね。
ということで、「Apache Solr入門」を参考に
Senを導入しようとしたんですが、これがちゃんと動かない。
どうも、今はlucene-gosenというのがあって、それを使うんですね。
「Apache Solr入門」のサンプルのlucene-gosen対応(1章から4章)
http://johtani.jugem.jp/?eid=44
lucene用のライブラリということで、非常にお手軽です。