Apache Solr 3.6からはKuromojiという形態素解析が初期の状態で含まれる
しばらく前に
Apache Solrで形態素解析をしたいときはlucene-gosenを使うという話
http://digiclu.hatenablog.com/entry/2012/03/25/201724
という記事を書きましたが、
先月リリースされた3.6では
Kuromojiという日本語形態素解析が初期の状態から
含まれるようになっています。
Lucene/Solr 3.6.0リリース / 「Apache Solr入門」のサンプルのKuromojiとlucene-gosen対応(1章)
http://johtani.jugem.jp/?eid=76
あと、3.6をそのまま動かした場合にエラーが出たんですが、
その件については、
solr3.6の起動時のエラー:org.apache.solr.common.SolrException: undefined field text
http://d.hatena.ne.jp/treeapps/20120504/p1
を参照すればおkでした。