Re: 重複符号化文字 (LE-talk-ja 237) - Legacy Encoding Project

"NARUSE, Yui" <narus****@airem*****> wrote:
> 確かに由来はそうですし、語義もそうですが、
> XMLにおけるencodingと同じものと理解しています。

「XML の encoding 属性と同じ」という理解がどうして
「CP932 というのはある文字集合と Unicode との対応表」
という理解になるのかわかりませんが、コードページの語義が
対応表でないなら、対応表だという理解を根拠とされても...

> >> libiconv の場合は外に流れるケースが少なからずあるかと思います。
> > どうやって?
> アプリケーションからlibiconvを用いて、文字列を
> CP932からNEC特殊文字とIBM拡張文字を区別するUnicodeに変換し、
> そのままその文字列を外に流しちゃう人って絶対いますよね。

仮に libiconv が「区別するUnicodeに変換」することを許すなら、
それはもはや内部コードではないでしょう。

> >> Unicode へのコンバータ作るだけで実装自体は終わりますね。
> > では iconv が今回対象の文字コードをサポートしているのだから
> > もういい事になってしまうのでは?
> Perl/Encode等はiconvを使いませんから。
> これらが自前で抱えているコンバータにも手を入れませんと。

だから、「今すぐ」でなくとも移行というのが現実的でない
ということなのでは? いままで移行してないなら、では一体
いつになったら移行するのです? 今使えているシステムの
「寿命」が尽きる時というのがせいぜいではないのですか?
--
のぞみ

Legacy Encoding Project

[LE-talk-ja 237] Re: 重複符号化文字