[LE-talk-ja 58] Re: ISO-2022-JP-MS について

Back to archive index

Yanagisawa yanag****@gmail*****
2006年 4月 12日 (水) 22:50:12 JST


柳沢と申します。

On Apr 11, 2006, at 3:10 AM, Kazuhiro Kazama wrote:

> On 2006/04/07, at 14:51, NAOI Yasushi wrote:
>> 「マッピングが異なっていても文字は表示される」というのはどう 
>> いう
>> 意味ですか? Macユーザですが、それらしい例を思いつかない
>> ので。
>
> 普通にMacで使っていたら,体験しないかもしれません.
>
> たとえば,異なるコンバータでUnicodeに変換した時に一部の 
> 文字のマッピン
> グが違う場合とか,そのような文字を明示的にUnicodeの符号 
> 位置で指定した
> 場合の話です.

自分が Mac OS X 上でときどき目にする例ですが(普通に 
Macで使っていないのかも)、

web ページで、charset=EUC-JP だけど実際には EUC-JP- 
MS だとか charset=SHIFT_JIS なのに cp932 なページは、 
Mac OS X 上では web ブラウザによって見え方が違います。
文字コードの変換というよりむしろ charset の解釈の違いかも 
しれませんが。

Mac OS X に最初から付いてくる Safari だと、MS 拡張の 
文字は化けてしまいます。
(文字コードが不正であることを示す特殊なグリフで表示される)
一方、Mac OS X 版の FireFox だとたいてい表示されます。
どちらの挙動が望ましいのかはよくわかりませんが。

実装の詳細を調べてはいませんが、内部的にはどちらもテキストデータ 
が文字描画 API に達するまでに Unicode への変換が行わ 
れていると思われます。

ちなみに、両ブラウザで http://www.mysql-partners-jp.biz/techinfo/ 
tech_01.html の表を見てみたところ、
Safari は NEC特殊文字のところだけ表示できてその他は化ける 
一方、FireFox だと NEC特殊文字、EEEF - EEFC あ 
たり、FA40 - FA53 あたりが化けて(数字系が半角カナになって 
いる)他は表示されることがわかりました。微妙です。

しかしこのページ自体が charset=shift_jis なのはあえてこの 
ようなテストに使われることを狙ってるのかな:-p
ローカルにこのページをコピーして charset=Windows-31J にし 
たら Safari では全部の文字が正しく表示できるようになりまし 
た(おおっ)。FireFox の方は charset=shift_jis のと 
きと変わりません。




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index