でじくる。

主にプログラムの話題などを扱うブログです。

Apache Solr

Apache Solr 3.6からはKuromojiという形態素解析が初期の状態で含まれる

しばらく前に Apache Solrで形態素解析をしたいときはlucene-gosenを使うという話 http://digiclu.hatenablog.com/entry/2012/03/25/201724 という記事を書きましたが、 先月リリースされた3.6では Kuromojiという日本語形態素解析が初期の状態から 含まれる…

PHPからApache SolrにJSONでデータをポストする

ApacheSolrにデータを投入する場合、 一般的にはxmlのファイルを読み込んだり MySQLなどからDataImportHandlerで読み込むと便利です。 ただ、クライアントサイドから頻繁にアップデートをする場合など、 PHPとかプログラムからデータを送りつけることができ…

Apache Solrで形態素解析をしたいときはlucene-gosenを使うという話

Apache Solrという全文検索エンジンがあります。 Javaで作られていて、PHPなんかからも簡単に扱えるので便利。 多国語対応する場合はn-gramが楽なのですが、 日本語しか使わない場合はまあ、形態素解析にしたいですよね。 ということで、「Apache Solr入門」…

Apache Solrはよいものだ

しばらく前に日本語全文検索がしたくて いろいろ探していました。 MySQL + Sennaというのも定番構成なんでしょうけど、 ちょっと違ったものを使ってみたかったので Apache Solrを採用することにしました。 Apache Solr http://lucene.apache.org/solr/ Lucen…