[Canna-dev 166] Re: dic patch -- a.p

Back to archive index

KANOU Hiroki kanou****@mil*****
2003年 1月 31日 (金) 19:53:22 JST


狩野です。文字関係の事ばかりやっていて、変換辞書に関して
話を振ったきりで申し訳ありません。

[Canna-dev 165] にて高水さん:
> 以下は a.p に対するパッチです。ご検討ください。

ありがとうございまあす。これから見せていただきます。

> 今回の修正分も含め,「なぜ?」という語が "#KK" になっています。
> 何か理由はあるのでしょうか。

昔の話なので細部は覚えていませんが、だいたい以下の通りだと
思います。

1) 商品名だから。

#KK はもともと会社名を意図してつけられた名前だったのでしょうが、
現在の分類体系では、地名・人名に分類されない固有名詞すべてを含む
ことになっています。商品名・商標名もこの中に入ります。
「イーサネット」が #KK になっているのは、富士ゼロックスの
登録商標だからだと思います。

2) 地名にすると接尾語がついてうっとうしいから

#CN は市町村名が典型的で、昔は「市」「町」などの地名用の接尾語
(#CNSUC) が接尾語として後ろについて一文節を構成するようになって
いました。デフォルトの付属語辞書には入っていませんので
(use-dictionary) に "suffix" を入れないと有効になりません。

[Canna 1148] (93/07/18) で #CNS という、接尾語付きの地名
(「北海道」とか) を表すための品詞が作られましたが、それ以前は
「英国町」などが出てくるのを避けるには #KK にするしか無かったのが
原因かもしれません。当初の pubdic からの単語でしたら、Wnn3 の
品詞分類とその扱いが影響しているものと思います。

ゆくゆくは、細目を決めて再分類をするべきだと思います。

狩野 宏樹  <kanou****@mil*****>



Canna-dev メーリングリストの案内
Back to archive index