dune
FZH01****@nifty*****
2005年 5月 4日 (水) 22:39:46 JST
極悪です。 duneさんの[morogram-users] morogram-0.7.1x_r1.36( MSVCR71.dll 追加)から >使用例:古今集(kokin.txt)と源氏物語(genji.txt)で試します。 >件の「あひ見むと頼め」は「頼」が genji.txt では漢字、kokin.txt では >仮名なのでこの結果には出てきません、残念。kakasi 等で前処理すれば、 >表記も文の意味も無視して、音だけで比較できるはず。 ということで、kakasi で前処理してみました。今度は ok。 D:$ tconv utf-8 Shift_JIS kokin.txt|kakasi -JH|tconv Shift_JIS utf-8 1>kk_kokin.txt D:$ tconv utf-8 Shift_JIS genji.txt|kakasi -JH|tconv Shift_JIS utf-8 1>kk_genji.txt D:$ morogram.exe --p --f=1,0 --g=5,15 kk_kokin.txt 1>mg_kokin.txt 2>nul D:$ morogram.exe --p --f=1,0 --g=5,15 kk_genji.txt 1>mg_genji.txt 2>nul D:$ perl mgsm.pl mg_kokin.txt mg_genji.txt 1>mg_result.txt D:$ tconv utf-8 Shift_JIS mg_result.txt | more 2 たちにしわがめいいまさらに 13 1 1 2 のなみだなりけりおろかなる 13 1 1 2 わがみひとつのためになれる 13 1 1 2 がみひとつのためになれる 12 1 1 2 たちにしわがめいいまさら 12 1 1 2 ちにしわがめいいまさらに 12 1 1 2 つりするあまのうけなれや 12 1 1 2 なみだなりけりおろかなる 12 1 1 2 のなみだなりけりおろかな 12 1 1 2 はなのさかりはありなめど 12 1 1 2 もりのしたくさおいぬれば 12 1 1 2 わがみひとつのためになれ 12 1 1 2 おしきものにぞありける 11 1 1 2 がみひとつのためになれ 11 1 1 2 きにんのこころなりけり 11 1 1 2 きのうきょうとはおもは 11 1 1 2 ごがつまつはなたちばな 11 1 1 2 すまのうらにもしおたれ 11 1 1 2 たちにしわがめいいまさ 11 1 1 2 たちばなのこじまのさき 11 1 1 2 ちにしわがめいいまさら 11 1 1 2 ちりなむのちのかたみに 11 1 1 2 つりするあまのうけなれ 11 1 1 2 なのさかりはありなめど 11 1 1 2 なみだなりけりおろかな 11 1 1 2 にしわがめいいまさらに 11 1 1 2 にんのとがむるかおりに 11 1 1 2 のしたつゆはあめにまさ 11 1 1 2 のなみだなりけりおろか 11 1 1 2 はなのさかりはありなめ 11 1 1 2 ひとしれずおもふこころ 11 1 1 2 みだなりけりおろかなる 11 1 1 2 みひとつのためになれる 11 1 1 2 もりのしたくさおいぬれ 11 1 1 2 よのなかをおもひはなれ 11 1 1 2 りするあまのうけなれや 11 1 1 2 りのしたくさおいぬれば 11 1 1 2 りまたしるひともなきこ 11 1 1 2 わがみひとつのためにな 11 1 1 〜 中略 〜 2 あはれとぞおもふ 8 1 1 2 あひみむとたのめ 8 1 1 2 あまのうけなれや 8 1 1 〜 以下省略 〜 -- 極悪, mailto:FZH01****@nifty*****