NARUSE, Yui
narus****@airem*****
2006年 5月 19日 (金) 09:25:36 JST
成瀬です。 Nozomi Ytow wrote: >> IBM拡張文字やNEC選定IBM拡張文字の話でしたら、 >> それらは「同じ文字」ですので問題ないと思いますけれど。 > > 同じ文字でも違うコードポイントなので、それを > 無条件に unify するのは round trip 的に問題かと。 > Unicode への移行を早めるために unify するというのは > アリとは思いますが、だったらそもそもレガシーやめる > べきでしょう。そうではなくて、現状の資産を使わざるを > 得ないのだから、round trip は保証すべきだと思います。 > その上で、unify するオプションもあっていいでしょう。 まず、収録されている文字をご覧いただいた上での発言でしょうか。 以下ご覧いただいているという仮定で話をします。 いかなる理由があろうともroud tripを保障するというのは、 一つの方針でしょう。 しかし、今回の文字群は、 * 似ている文字でなく「同じ文字」である これらは重複符号化されている文字であり、違うのはコードポイント以外だけ * Microsoftも正規化している http://support.microsoft.com/default.aspx?scid=kb;ja;JP170559 * 仮に区別しようとおもって、別のUnicodeコードポイントが無い 典拠であるMicrosoftでも正規化しているため、 Unicodeに一つしかコードポイントがありません。 外字領域にマッピングするくらいしか方法はないでしょう という事情から、round tripを保障する必要も無いし、 保障できないと思われます。 -- NARUSE, Yui <narus****@airem*****> DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA