[groonga-dev,01059] 【mroonga】類似文書比較にて、トークンが多く含まれるでは無く、似ている文章のスコアを高くする

Back to archive index

今井真宏 masaz****@gmail*****
2012年 10月 22日 (月) 17:56:14 JST


いつもお世話になっています、masaと申します。

mroonga2.07をラッパーモードで使用し、類似文書検索
機能で、テキストの近似値を取得したいと考えています。

そこで、質問なのですが、
「多く含まれる」ではなく「似ている」文書のスコアを高くできないものでしょうか?

具体的には、DBのmroongaテーブルのカラムに
「あああ」
「ああああああ」
と入っているとします。現在は「あああ」で検索すると、スコアは
「ああああああ」のほうが高く取得します。
完全一致している「あああ」のスコアを最高スコアになるように出来ないでしょうか?

ご回答いただけますと幸いです。

よろしくお願い足します。

--
masa
masaz****@gmail*****




groonga-dev メーリングリストの案内
Back to archive index