[Senna-dev 733] Re: 分かち書きされたINDEX情報を取得したい

Back to archive index

Tasuku SUENAGA a****@razil*****
2007年 12月 22日 (土) 00:45:39 JST


末永です。
こんばんは。

2回MeCabの処理が走るのはもったいない感じがしますね。

事前にmecabで分かち書きをしたものをMySQLに格納し、
USING DELIMITEDのオプションを指定して
インデックスを作成すれば、
2回MeCabを呼ぶ必要はなくなります。
http://qwik.jp/tritonn/reference.html

しかし、
DELIMITEDオプションでは、
後方一致検索ができなくなっちゃいます。

いかがでしょうか。

Ryousuke Wayama さんは書きました:
> はじめまして。
> 和山と申します。
> 
> 今SNS上ではてなの「おとなり日記」の
> ようなものを作っています。
> そのときに特長語を取りたいため、自前でmecabで
> 分かち書きしたものから特長語を作って、それを
> Trittonに投げて類似文章を検索してきております。
> 
> しかし、せっかくTritton投入時にmecabで分かち
> 書きされているので、それを使用できないかと調べて
> みました。
> 
> sennaのAPIから直接インデックスファイルを覗いて
> くる方法はあったのですが、select時に取得する方法は
> ないものでしょうか?
> 
> よい知恵をお貸しいただければ幸いです。
---
Tasuku SUENAGA <a****@razil*****>




Senna-dev メーリングリストの案内
Back to archive index