[morogram-users] Re: こんばんは!

Back to archive index

Shigeki Moro s-mor****@hanaz*****
2005年 4月 14日 (木) 14:17:29 JST


師です。

どのようなパソコンの環境なのか等、基本的なことをお教えいただけな
いと、充分な回答をすることはできません。以下の回答では、一般論を
述べます。

On Sat, 9 Apr 2005 00:49:16 +0900
"ジョウレントモカ" <55-jo****@ares*****> san wrote:

> 漢詩の統計的、数量的に分析したいのですが、使用できるデータは
> テキストデータのみ、と考えてよろしいでしょうか?

morogram が扱えるのはテキストデータのみです。基本的に、単一のテ
キストファイルに対する文字単位のNグラムによる頻度分析しかできま
せん。複数テキストの比較や各種統計的な分析については、他のソフト
ウェアを組み合わせることになります。

> また結果を分析するよい方法はないでしょうか?

いろいろありますが、目的によって変化すると思います。

> また、作者の違う作品を比べて作者ごとに比較したい、ということなのですが
> 作者の名前も頻度に数えられるのを()でくくってそこを頻度に加えない、とか
> <>で囲われた文字をひとつの文字として認識する、とか
> ある文字に限定して頻度を数える
> 等出来ましたらご指導いただけますでしょうか?

morogram ではできませんので、他の方法でやることになります。上記
の()や<>を使った方法は、それを実現するためのフィルタを書けば
可能でしょう(<>の方は適当に &M......; に割り当てるとか)。

『漢字文献情報処理研究』2号(http://www.jaet.gr.jp/jj/2.html)所
収の拙稿では、XMLを用いた同様の方法について考察していますので、
参考になるかもしれません。

Shigeki Moro

Hanazono University
s-mor****@hanaz*****
http://moromoro.jp




morogram-users メーリングリストの案内
Back to archive index