Hiroyuki Komatsu
komat****@taiya*****
2004年 4月 15日 (木) 03:53:42 JST
ひろゆき(こ)です。 At Tue, 13 Apr 2004 06:46:43 +0000, Hiroyuki Ikezoe wrote: > > lookup, lookup_all, lookup_compact, lookup_compact_all のおおざっぱな > > 挙動をまとめると以下のようになります。 > > > > lookup: 前方一致 3件 + 完全一致 7件 (最大 10件) > > lookup_all: 前方一致 3件 + 完全一致全部 > > lookup_compact: 前方一致 1件 + 連文節予測 1件 (最大 2件) > > lookup_compact_all: 前方一致 1件 + 連文節予測 1件 + 完全一致全部 > > > > このうち lookup, lookup_compact はインクリメンタルに候補が変化していく > > 入力モード用を想定しています。 *_all はスペースキーを押した後の > > 変換モード用を想定しています。 > > これを見ると、入力モードのときだけ連文節予測がされるんですが、これはなぜですか? > 例えば、こまつさんの例でいうと、 > lookup(よろしくおねがいします) > の時に「よろしくお願いします」が出ませんよね? lookup(よろしくおねがいします) => 「よろしくお願いします」 は「連文節変換」なので、システム的には出ます。出ないとしたら 精度と学習結果の影響です。 lookup では、 lookup(よ) => 「よろしくお願いします」 lookup(よろしくお) => 「よろしくお願いします」 のような連文節予測が出ません。単に実装していないだけなので、 そのうちやります。 > 文節を無視して長文を一気に変換しようとするんでこのようになってないと使い勝手 > が悪いのです。(←つまりあんまり予測の恩恵を受けてない。たまに使う程度) 文節の操作が可能な、より一般的な連文節変換機能を実現すると、もう少し 使い勝手がよくなると思います。ですが、今は辞書のデータ構造をいじって いるので、実装はちょっと先の話になりそうです。 変換できない文章に対する、単語の学習や文法規則の強化などは、わりと すぐにできるので、変換できない文章を教えてくださると助かります。 > uimがlookup_compactに対応してないというのも原因の一つではあるとは思いますが。 余談ですが、 lookup_compact だと、「連文節変換」を学習させると「連文節予測」が 候補にでなくなるので、ちょっとむかつきました。この辺はなんとか したいなと考えています。 -- 小松弘幸 ----------------------- http://taiyaki.org/