[mecab-users 437] コストが同じ場合の最適パスについて

Back to archive index

中道 健一 nkmc****@souya*****
2011年 7月 28日 (木) 19:30:19 JST


中道と申します。

ドキュメントを見てもわからなかったのでご教示いただけると助かります。

コストが同じになった場合の最適解はどのように選ばれるのでしょうか?
不定か出現順かなと思ったのですが、%pbを指定して最適パスの結果を
表示すると、どうやら全て*のものが最適解となるように見えます。
これはどのように決定されるのでしょうか。

また、特定の語の生成コストを小さくして最適解として選ばれるように
しようと思ったのですが助動詞のコストが自動的に調整されるような感じで
トータルのコストが同じになってしまいます。
このあたりの調整はどこで行うのがよいのでしょうか。


試してみた例。辞書はIPADICで、ユーザ辞書に「答え」を登録し
生成コストを小さくしています。
(MeCab 0.98使用)

mecab -N5 -u user.dic
--node-format=%pb,%m,%h,%phl,%phr,%c,%pC,%pn,%pc,%H\\n

間違えて答えた
*,間違え,31,625,625,6943,-815,6128,6128,動詞,自立,*,*,一段,連用形,間違
える,マチガエ,マチガエ,
*,て,18,307,307,5170,-8415,-3245,2883,助詞,接続助詞,*,*,*,*,て,テ,テ,
*,答え,31,625,625,7100,138,7238,10121,動詞,自立,*,*,一段,連用形,答え
る,コタエ,コタエ,
*,た,25,435,435,5500,-7899,-2399,7722,助動詞,*,*,*,特殊・タ,基本形,た,
タ,タ,
EOS
*,間違え,31,625,625,6943,-815,6128,6128,動詞,自立,*,*,一段,連用形,間違
える,マチガエ,マチガエ,
*,て,18,307,307,5170,-8415,-3245,2883,助詞,接続助詞,*,*,*,*,て,テ,テ,
 ,答え,38,1285,1285,55,1175,1230,4113,名詞,一般,*,*,*,*,答え,*,*,
【ユーザ辞書登録】
*,た,25,435,435,5500,-1891,3609,7722,助動詞,*,*,*,特殊・タ,基本形,た,
タ,タ,
EOS
*,間違え,31,625,625,6943,-815,6128,6128,動詞,自立,*,*,一段,連用形,間違
える,マチガエ,マチガエ,
 ,て,33,930,930,11728,-7514,4214,10342,動詞,非自立,*,*,一段,連用形,て
る,テ,テ,
*,答え,31,625,625,7100,-7321,-221,10121,動詞,自立,*,*,一段,連用形,答え
る,コタエ,コタエ,
*,た,25,435,435,5500,-7899,-2399,7722,助動詞,*,*,*,特殊・タ,基本形,た,
タ,タ,
EOS
*,間違え,31,625,625,6943,-815,6128,6128,動詞,自立,*,*,一段,連用形,間違
える,マチガエ,マチガエ,
*,て,18,307,307,5170,-8415,-3245,2883,助詞,接続助詞,*,*,*,*,て,テ,テ,
 ,答え,38,1285,1285,55,1175,1230,4113,名詞,一般,*,*,*,*,答え,*,*,
【ユーザ辞書登録】
 ,た,25,439,439,8828,-582,8246,12359,助動詞,*,*,*,特殊・タイ,ガル接続,
たい,タ,タ,
EOS
*,間違え,31,625,625,6943,-815,6128,6128,動詞,自立,*,*,一段,連用形,間違
える,マチガエ,マチガエ,
*,て,18,307,307,5170,-8415,-3245,2883,助詞,接続助詞,*,*,*,*,て,テ,テ,
 ,答え,38,1285,1285,5495,1175,6670,9553,名詞,一般,*,*,*,*,答え,コタエ,
コタエ,
*,た,25,435,435,5500,-7331,-1831,7722,助動詞,*,*,*,特殊・タ,基本形,た,
タ,タ,
EOS

よろしくお願いいたします。




mecab-users メーリングリストの案内
Back to archive index