[LE-talk-ja 176] Re: 重複符号化文字

Back to archive index

小崎資広 m-kos****@ceres*****
2006年 5月 19日 (金) 11:05:19 JST


小崎です。


> * Microsoftも正規化している
> > http://support.microsoft.com/default.aspx?scid=kb;ja;JP170559
>
> これはするしかなかったからではないかと推測します。


 このプロジェクトの「現実を見よう!」方針からすると、
マイクロソフトが仕方ないと思っているどうかはともかく
必要ないってことになりませんか。

たとえば〜問題なんかはみんなが困っている。という所が重要だと思っていて、
だれか困っている人がいる「かも」しれない、ってのでコーディングしちゃうのは、
あとでコミュニティーにマージ働きかけるときにもめますよ。
(特にメンテナが英語圏の人の時には)

脱線しちゃいますが、
向こうの人から見たら、レガシーエンコーディング対応ってのはuglyな行為なわけ。
で、僕らはuglyなのは分かった上で、頻度が高すぎるから現実をみて押し込もうと
してるわけでしょ。

そこで、頻度が低いモンがまじってたら、向こうからしたらこちらの活動全体が
あいつらは規格のスミをつついてありもしない問題を大げさに騒いでいるだけだ。
と映るんじゃないかと危惧しています。

結構大変ですよ。説得。逆にUnicodeとかマジメに勉強した人の方が。
向こうは、どのぐらい頻繁に困っているかが肌で分からないからスジ論に陥りがちで
「えーい、おまえら黙って正規のShiftJIS使え」って話に10回ぐらいは話を
戻されるんですから。




> > * 仮に区別しようとおもって、別のUnicodeコードポイントが無い
> > 典拠であるMicrosoftでも正規化しているため、
> > Unicodeに一つしかコードポイントがありません。
> > 外字領域にマッピングするくらいしか方法はないでしょう
>
> Unicode 3.2 からは valiation selector が使えるので、
> 内部的に表現できない訳ではありません。
> 規定されている組合せ以外は外に出してはダメです、もちろん。


 外に出せないコードを作るのはもうやめません?
絶対裏切り者が出てきて、外に出しやがりますよ。
昔はShiftJISも内部コードだったんですから。
-------------- next part --------------
HTMLの添付ファイルを保管しました...
다운로드 


Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index