Nobuyoshi Nakada
nobu @ sharui
2006年 6月 2日 (金) 16:44:50 JST
なかだです。 At Fri, 2 Jun 2006 10:09:04 +0900, Yuya Kato wrote: > > > というか、UTF-8からUTF-16への変換はpack/unpackだけでできます。 > > > Little endian: > > > $ ruby -e 'p (ARGV[0]+"\0").unpack("U*").pack("v*")' Comments > > > "C\000o\000m\000m\000e\000n\000t\000s\000\000\000" > > おぉ、そうでしたか。日本語も全然大丈夫ですね。 > > 適用しました。ありがとうございます。 > あー、よく考えたら、サロゲートペアで表現される文字はアウト? > 具体的な文字を知らないので試していませんが・・・。 Windowsでいうwchar_tってUCS2じゃなくてUTF16、つまりmulti wide characterですか? 本気でサロゲートペアをサポートするなら現状のpack/unpackだけじゃ 無理ですね。 -- --- 僕の前にBugはない。 --- 僕の後ろにBugはできる。 中田 伸悦