[Anthy-dev 3331] Re: ja.wikipedia を解析して名詞の頻度リストを作りました

Back to archive index

UTUMI Hirosi utuhi****@yahoo*****
2007年 1月 25日 (木) 18:15:33 JST


// To: Anthy-dev
// Bcc: 大泉さん

内海です。

解析ツール (generate-wikidic) を改訂しました。
http://www.geocities.jp/ep3797/anthy_dict_01.html
生成済み辞書 (wikidic-noun.dic.bz2) も
同じところに移動しました。

最近の Mecab では未知の (ipadic に載っていない) 名詞を
推測して取り出せるようなので、
それらを集めてカタカナ語辞書を作りました。
wikidic-unknown-katakana-noun.bz2
こちらも同じ場所に置いています。
(実際に使用するときは読みがなの中点を削除してください)

ツールの README を全面的に書き換えているので、
お使いになる前にご一読ください。
--------------------------------------
Start Yahoo! Auction now! Check out the cool campaign
http://pr.mail.yahoo.co.jp/auction/




Anthy-dev メーリングリストの案内
Back to archive index