dune
FZH01****@nifty*****
2004年 4月 5日 (月) 01:38:39 JST
極悪です。 dune さんの [morogram-users] Re: 1000字あたりの使用頻度の実装化 から >単語単位で動くインチキ morogram です。Perl v5.8.2 専用です。 >morogram-sort-0.7.1.c はいじって再コンパイルしています。 スタンドアロン化しました。 http://hpcgi1.nifty.com/dune/gwiki.pl?p=N%2Dgram perl がなくても動きます。 名前を moroWgram.pl(moroWgram.exe)に変更しました。 プログラムをマウスで直接クリックしても実行できます。 空白のほか、漢字・ひらがな・カタカナの境界および句読点 を単語の境界と認識するようになっています。文字コードは utf8 や shiftjis,euc-jp などを自動認識します。 D:% moroWgram.exe -f4 -n4 D:\DATA\電脳国文学\AOZORA\kenji\gintetsu.txt ------- First Stage ------ ------- Second Stage ------ offset length is 2. creating pointer table...done. sorting pointer table...done. counting coincidence number of characters...done. largest coincidence number is 8. calculating 4-gram frequency. ------- Third Stage ------ 4 見 えない 天 の 川 の 6 5 見 えない 天 の 川 5 7 天 の 川 の 水 5 4 えない 天 の 川 の 5 7 の 川 の 水 4 5 の 方 を 見 4 5 ジョバンニ が 云 いました 4 4 を 引 っ 込 4 5 見 えない 天 の 4 17 天 の 川 の 4 4 窓 から 顔 を 4 6 女 の 子 が 4 4 男 の 子 が 4 5 えない 天 の 川 4 Time wasted : 17.4[s] D:% -- 極悪, FZH01****@nifty***** http://hpcgi1.nifty.com/dune/gwiki.pl?