NIIBE Yutaka
gniib****@fsij*****
2010年 6月 3日 (木) 10:43:14 JST
2010/5/29 NIIBE Yutaka: > [Anthy-dev 3470] の主張(繰り返すことで賢くなる)は、現在の実装においてホ > ントなんでしょうか? (賢くなるかどうかは別として)情報が集積されるためには、 (0) 最初のコーパス関連が空の anthy.dic-0 があるとする (1) proccorpus が anthy.dic-0 を使って parsed_data-0 を生成 calctrans が parsed_data-0 を使って corpus_info,weak_words を生成 次の anthy.dic-1 を作る (2) proccorpus が anthy.dic-1 を使って parsed_data-1 を生成 calctrans が parsed_data-0 と parsed_data-1 を使って corpus_info,weak_words を生成 次の anthy.dic-2 を作る とここまでは 9100h の update_params2 はあっているとして、次からの段階は、 (3) proccorpus が anthy.dic-2 を使って parsed_data-2 を生成 calctrans が parsed_data-0 と parsed_data-1 および parsed_data-2 を使って ^^^^^^^^^^^^^ corpus_info,weak_words を生成 次の anthy.dic-3 を作る [...] (N) proccorpus が anthy.dic-{N-1} を使って parsed_data-{N-1} を生成し、 calctrans が parsed_data-0.. parsed_data-{N-1} の全部を使って ^^^^^^^^^^^ corpus_info,weak_words を生成 次の anthy-dic-{N} を作る じゃないでしょうか。 これを試してみるとして、正しいかどうかはおいておいて、「こっちの方が良い」か どうかを判断するのには、どうしたらいいでしょう。 --