kousa****@nttda*****
kousa****@nttda*****
2007年 6月 26日 (火) 11:08:21 JST
こんにちは。幸坂です。 > > ふと思ったのですが、N-Gram対応ってどうなのでしょう? fulltextbをご利用ください。 fulltextb=N-gram、 fulltext=形態素解析、 fulltextu=ユーザ定義です。 詳細はREADMEを参照してください。 > 同時インデックス利用制限で落ちます(涙) 1クエリー内で同時にludia.max_n_index_cacheより多くのインデックスを 使用すると、落ちます(涙) postgresql.confのludia.max_n_index_cacheの値を大きくしてください。 ludia.max_n_index_cacheの値はLudia1.0.0以降で設定可能です。 落ちるのはバグなので、Ludia1.2.0からは修正します。 > 私のまわりの利用例でも、N-GRAMが多いと思います > ノイズよりも検索もれの方がいやですね なるほど、参考になります。 引き続き「追加機能の要望、適用事例」を募集しております。 よろしくお願いします。 > -----Original Message----- > From: ludia****@lists***** > [mailto:ludia****@lists*****] On Behalf > Of TANAKA Masayuki > Sent: Saturday, June 23, 2007 10:18 AM > To: ludia****@lists***** > Subject: [Ludia-users 55] Re:【お願い】追加機能の要望、適用事例を教えてく ださい > > こんにちはたなかです > > > ふと思ったのですが、N-Gram対応ってどうなのでしょう? > > Sennnaが純粋なN-Gramも使えるよとうたっているので > > 大丈夫だとは思うのですが、 > > http://d.hatena.ne.jp/tasukuchan/20070323 > 上記のページが参考になると思います。 > > Sennaは対応していますが、MySQLバインディングは現在 > 対応していないのかな? > > Tritonn は利用していないのでわからないですが、昔のでは > この辺の動作にひっかかります > > Ludia でも標準パラメーターだとひっかかると思います > > > 実際問題、辞書のメンテナンスなんてしていられないので、 > > 少々高価なハードウェアを買ってでも純粋N-Gramを > > 使いたいなあと思っております。 > > 私のまわりの利用例でも、N-GRAMが多いと思います > ノイズよりも検索もれの方がいやですね > > あとはPostgreSQLの利点を生かしてCE(継承)を使う > 手もあると思います > > 月や年ごとのテーブルを分割すると、結構パフォーマンスが > あがります > > ※検証済み(年2万件のPDFを20年分ぐらいだったような、、、) > > ただし親を選択して、全体に対して検索しようとすると > 同時インデックス利用制限で落ちます(涙) > > ※検証済み > > 頻繁に検索されるテーブルは通常のインデックスサイズで > 古いデータとかは小さくするなどすればいいのかもしれない > ですね。。。 > > ※すみません、検証できていません > > たなか > > _______________________________________________ > Ludia-users mailing list > Ludia****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/ludia-users >