UTUMI Hirosi
utuhi****@yahoo*****
2005年 9月 29日 (木) 17:40:14 JST
内海です。 name.t にいくつか typo を混ぜていました。 修正しましたので merge をお願いします。 gcanna.ctd に関しては作業に当たって心がけたことを anthy_gcanna_ut-20050929 の README.ja に書きました。 よく使う語を十語くらい修正するだけでも、使い勝手が 変わってくると思います。 # *********************************************************** # 辞書の作りかた # *********************************************************** 辞書はすぐに古くなるので、多くの方が引き継いでくださると うれしいです。 辞書の形式は次の通り。 読み 品詞 第一候補 第二候補... (例) どうじょう #T35*134 同上 #T30*126 同情 #T30*123 同乗 "*134" などの頻度は Canna 用のものなので、 Anthy では必要ありません。 従って次のような形でも結果は同じになります。 どうじょう #T35 同上 #T30 同情 同乗 品詞記号については同梱の canna_hinsi.txt を参照してください。 Anthy では複合語を登録することもできます。 これは Anthy の人名辞書 (name.t) などで利用されています。 形式は次の通り。 おだかずまさ #JN #_2小田_4和正 "_2小田" が "おだ" の 2文字分に対応し、 "_4和正" が "かずまさ" の 4文字分に対応します。 # *********************************************************** # 改変の方針 # *********************************************************** 全体的には表記を丸く現代的にすることを目指しています。 1. 日常的に使われている表記を追加する 現状の候補: 昼ごはん 昼御飯 改変後の候補: 昼ご飯 昼ごはん 昼御飯 2. 候補の並びを Google のヒット数の順番にする (恣意的に設定しない) ただし漢字二文字のような場合は適切にヒット数が 出ないこともあるので、明らかに不適切なときは 手を加える。 変更前: #T15*117 正正堂堂 #T15*116 正々堂々 変更後: #T15*117 正々堂々 #T15*116 正正堂堂 3. 単語を追加するときは自分の好みだけで追加しない 例えば歌手名を追加するときは過去の売上げランキングの 上位のものを追加する。あまりにもマイナーなものは足さない。 自分の趣味のジャンルの単語ばかり追加しない。 特殊な語を入れすぎると前後の単語の繋がり次第で 誤変換を起こすかもしれない。 -------------------------------------- Know more about Breast Cancer http://pr.mail.yahoo.co.jp/pinkribbon/ -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: name.t_20050929.diff.bz2 型: application/x-bzip2 サイズ: 1076 バイト 説明: name.t_20050929.diff.bz2 다운로드