Kazuhiro Kazama
kazam****@mac*****
2006年 4月 7日 (金) 12:50:19 JST
On 2006/04/07, at 10:47, NARUSE, Yui wrote: >> しかし,それとは関係ない部分で,単に扱える文字レパートリーを増やす >> こと >> が目的で新しい符号化文字集合をデファクト化しようとするとしたら違う話 >> で,別のよりよい方法がすでにオーソライズされている場合には,そちら >> を使 >> う方向の努力の方がよいと思います.たぶん,元の記事もそういう意図だ >> と思 >> います. > > 現状で変態的なものしか存在しないならばともかく、 > CP50221 のような比較的マシなものがあるならば、 > そちらの方がいいでしょうね。 > # CP50221 がなければ意見が変わっていた可能性は高いです。 > # いや、 CP50220 を支持してたかな。 最近はこの問題にあまり関わっていなかったので,その辺の話を詳しく知りた いですね. なお,基本的にOSベンダによってすでに実装されて,ユーザによってある程度 使われているものは検討する価値があると思います.ただし,場合によって は,すべてには入れないということも考えなければいけないと思っています. >> 少なくとも,「より多くの文字を扱いたい」は,日本を含めた漢字を扱う >> アジ >> ア圏の人間の願いなわけですが,それなら今はJIS X 0213は無視できない >> し, >> また従来の機種依存文字が,機種依存文字でない形で扱える,しかも従来は >> Windowsとは非互換の機種依存文字のマッピングを採用していたMac OS Xなど >> でも正しく表示できるということは重要だと思います. > > これは UTF-8 の話ですよね? > 最初 Shift_JIS-2004 や EUC-JIS-2004 の話かと思ったのですが。 違います.すでに前の投稿で書きましたが,OSベンダや標準化団体では, UTF-8で使うことを前提に検討が進んでいます. # 今,みんなで無視することで歴史的になかったことにされようとしている のが,JIS X 0212と,JIS X 0213のそのような符号化です(笑) > CP932 と CP51932、 eucJP-ms、ISO-2022-JP-MS の対応をまとめた表や、 > 個々の文字コードの詳細は森山さんが公開されてましたね。 > あれを Legacy Encoding Project でも公開してくださるとうれしいです。 私も昔に同様な表を作って公開したのですが,非常に多くのところから見に来 て頂いていました.正しくおこなわれた分析は,説得力や影響力がありますの で,それは重要だと思います. > マッピングは、各プロダクトで「CP932」と称されるものは、 > どれも近いマッピングになってきた気がしていますが、 > 他はだいぶ差がありそうですね。 > その辺の検証結果も公開を期待しておりますけれど。 やはり,マッピングにばらつきがあるわけですか…. 基本的に,一旦普及したものを変更するのは非常に難しいと言えます.だか ら,パッチを送っても,拒否される可能性も高いでしょう. しかし,ここで議論した結果をまとめて公開することで,(別の回避策がある とか,問題が緩和されるのなら)統一しようという動きが起こるかもしれませ ん. ただし,そのような影響があるゆえに,議論は慎重に行うべきだと思います. --- 風間 一洋 (kazam****@mac*****)