[morogram-users] Re: 1000字あたりの使用頻度の実装化

Back to archive index

dune FZH01****@nifty*****
2004年 4月 5日 (月) 01:38:39 JST


極悪です。

dune さんの [morogram-users] Re: 1000字あたりの使用頻度の実装化 から
>単語単位で動くインチキ morogram です。Perl v5.8.2 専用です。
>morogram-sort-0.7.1.c はいじって再コンパイルしています。

スタンドアロン化しました。
  http://hpcgi1.nifty.com/dune/gwiki.pl?p=N%2Dgram
perl がなくても動きます。

名前を moroWgram.pl(moroWgram.exe)に変更しました。
プログラムをマウスで直接クリックしても実行できます。
空白のほか、漢字・ひらがな・カタカナの境界および句読点
を単語の境界と認識するようになっています。文字コードは
utf8 や shiftjis,euc-jp などを自動認識します。



D:% moroWgram.exe -f4 -n4 D:\DATA\電脳国文学\AOZORA\kenji\gintetsu.txt
------- First Stage ------
------- Second Stage ------
        offset length is 2.
        creating pointer table...done.
        sorting pointer table...done.
        counting coincidence number of characters...done.
        largest coincidence number is 8.
        calculating          4-gram frequency.
------- Third Stage ------
4       見 えない 天 の 川 の   6
5       見 えない 天 の 川      5
7       天 の 川 の 水  5
4       えない 天 の 川 の      5
7       の 川 の 水     4
5       の 方 を 見     4
5       ジョバンニ が 云 いました       4
4       を 引 っ 込     4
5       見 えない 天 の 4
17      天 の 川 の     4
4       窓 から 顔 を   4
6       女 の 子 が     4
4       男 の 子 が     4
5       えない 天 の 川 4
Time wasted : 17.4[s]

D:%
-- 
極悪, FZH01****@nifty*****
http://hpcgi1.nifty.com/dune/gwiki.pl?




morogram-users メーリングリストの案内
Back to archive index