[LE-talk-ja 165] Re: LE-talk-ja での議論のまとめ

Back to archive index

NARUSE, Yui narus****@airem*****
2006年 5月 19日 (金) 09:25:36 JST


成瀬です。

Nozomi Ytow wrote:
>> IBM拡張文字やNEC選定IBM拡張文字の話でしたら、
>> それらは「同じ文字」ですので問題ないと思いますけれど。
> 
> 同じ文字でも違うコードポイントなので、それを
> 無条件に unify するのは round trip 的に問題かと。
> Unicode への移行を早めるために unify するというのは
> アリとは思いますが、だったらそもそもレガシーやめる
> べきでしょう。そうではなくて、現状の資産を使わざるを
> 得ないのだから、round trip は保証すべきだと思います。
> その上で、unify するオプションもあっていいでしょう。 

まず、収録されている文字をご覧いただいた上での発言でしょうか。

以下ご覧いただいているという仮定で話をします。
いかなる理由があろうともroud tripを保障するというのは、
一つの方針でしょう。
しかし、今回の文字群は、
* 似ている文字でなく「同じ文字」である
 これらは重複符号化されている文字であり、違うのはコードポイント以外だけ
* Microsoftも正規化している
 http://support.microsoft.com/default.aspx?scid=kb;ja;JP170559
* 仮に区別しようとおもって、別のUnicodeコードポイントが無い
 典拠であるMicrosoftでも正規化しているため、
 Unicodeに一つしかコードポイントがありません。
 外字領域にマッピングするくらいしか方法はないでしょう
という事情から、round tripを保障する必要も無いし、
保障できないと思われます。

-- 
NARUSE, Yui  <narus****@airem*****>
DBDB A476 FDBD 9450 02CD 0EFC BCE3 C388 472E C1EA



Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index