[Anthy-dev 3748] update_params2 (was: Re: anthy.dic の生成)

Back to archive index

NIIBE Yutaka gniib****@fsij*****
2010年 6月 3日 (木) 10:43:14 JST


2010/5/29 NIIBE Yutaka:
> [Anthy-dev 3470] の主張(繰り返すことで賢くなる)は、現在の実装においてホ
> ントなんでしょうか?

(賢くなるかどうかは別として)情報が集積されるためには、

(0) 最初のコーパス関連が空の anthy.dic-0 があるとする

(1) proccorpus が anthy.dic-0 を使って parsed_data-0 を生成
    calctrans が parsed_data-0 を使って corpus_info,weak_words を生成
    次の anthy.dic-1 を作る

(2) proccorpus が anthy.dic-1 を使って parsed_data-1 を生成
    calctrans が parsed_data-0 と parsed_data-1 を使って
    corpus_info,weak_words を生成
    次の anthy.dic-2 を作る

とここまでは 9100h の update_params2 はあっているとして、次からの段階は、

(3) proccorpus が anthy.dic-2 を使って parsed_data-2 を生成
    calctrans が parsed_data-0 と parsed_data-1 および parsed_data-2 を使って
                                 ^^^^^^^^^^^^^
    corpus_info,weak_words を生成
    次の anthy.dic-3 を作る
[...]

(N) proccorpus が anthy.dic-{N-1} を使って parsed_data-{N-1} を生成し、
    calctrans が parsed_data-0.. parsed_data-{N-1} の全部を使って
                                                   ^^^^^^^^^^^
    corpus_info,weak_words を生成
    次の anthy-dic-{N} を作る

じゃないでしょうか。

これを試してみるとして、正しいかどうかはおいておいて、「こっちの方が良い」か
どうかを判断するのには、どうしたらいいでしょう。
-- 




Anthy-dev メーリングリストの案内
Back to archive index