[LE-talk-ja 246] Re: 重複符号化文字

Back to archive index

Koichi Hyodo sio-0****@rh*****
2006年 5月 24日 (水) 15:48:47 JST


兵藤です

> From: Kazuhiro Kazama <kazam****@mac*****>
> Date: Tue, 23 May 2006 05:44:01 +0900
> Subject: [LE-talk-ja 239] Re: 重複符号化文字

> 結局レガシーエンコーディングに関しては,バグ(問題)も仕様(泣)
> なのかもしれないと思います.前向きな方法で問題を完全に解消できれ

(その仕様が今となっては問題ですが ^^;)
重複符号化されているのはバグではなく仕様でしょう。


> ばいいのですが,結局過去の因縁を引きづりすぎていて,完全に解消で
> きない.としたら,変えない方が,少なくとも問題をこれ以上増やさな
> いことになるからです.問題を増やされるのは非常に困ります.

既存の動作を変えないこと、新たな混乱の種をつくらないようにすること
に、私も同意します。その点でこのプロジェクトで既存のencodingの動作
を変更しないという方針はいいものだと思います。

新たな変換表を作ったり、変換器の外(変換器を使うアプリにとっては内部
だが明らかにそれは外 ^^;)に新たな符号化をもたらすようなアイデアは
極めて慎重に考えるべきだとも、思います。

OSを作るわけではないので、既存の変換が必要なアプリのために、既存の
変換器が使えるようになっていれば、変換器が置き換えられてしまうとい
う危惧・反対の余地がなくなりますし :-)


> 同じような,日本語関連のレガシーエンコーディングの「バッドノウハ
> ウ」や「危険な文字」を,とりあえずフリー形式で蓄積していこうかな
> というわけです.他の人は,どう思われるでしょうか?(あまり
> 同意が得られなければ,個人的にやろうと思っていますが)

賛成です。

文字集合(扱うことのできる文字の範囲・選択)が違うのだということを
強調していただけると助かります。

JISでいうGLの部分が、ASCIIとして解釈されたり、JISローマ字
として解釈されたり、ベンダ独自の解釈をされたりすることも、
加えていただければ、なお助かります。




PS.
余談ですが (^^;
いわゆる旧JISの呼出符号が間違っているのは、JIS規格票印刷時の
レイアウトミス(バグ)だという話ですよね。その後も確認せず他書を
孫引きしたライターが相次いで既成事実になってしまったという…。





Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index