[exerb-dev:0498] Re: snapshot20060531

Back to archive index

Nobuyoshi Nakada nobu @ sharui
2006年 6月 2日 (金) 16:44:50 JST


なかだです。

At Fri, 2 Jun 2006 10:09:04 +0900,
Yuya Kato wrote:
> > > というか、UTF-8からUTF-16への変換はpack/unpackだけでできます。
> > > Little endian:
> > > $ ruby -e 'p (ARGV[0]+"\0").unpack("U*").pack("v*")' Comments
> > > "C\000o\000m\000m\000e\000n\000t\000s\000\000\000"
> > おぉ、そうでしたか。日本語も全然大丈夫ですね。
> > 適用しました。ありがとうございます。
> あー、よく考えたら、サロゲートペアで表現される文字はアウト?
> 具体的な文字を知らないので試していませんが・・・。

Windowsでいうwchar_tってUCS2じゃなくてUTF16、つまりmulti wide
characterですか?

本気でサロゲートペアをサポートするなら現状のpack/unpackだけじゃ
無理ですね。

-- 
--- 僕の前にBugはない。
--- 僕の後ろにBugはできる。
    中田 伸悦



exerb-developer メーリングリストの案内
Back to archive index