Tadamasa Teranishi
yw3t-****@asahi*****
2006年 3月 28日 (火) 09:15:05 JST
寺西です。 以前、「NKF における UNICODE マッピングの問題」を指摘しましたので、 その確認を nkf 2.0.6 で行いました。 UNICODE -> EUC-JP に変換した時に次のような変換が行われます。 NKF 2.0.4 NKF 2.0.5 NKF 2.0.6 I (U+0130) (0x00) 削除 削除 ' y (U+00fd) (0xc0) 削除 削除 -D (U+00d0) (0xc0) 削除 削除 _ E (U+0114) (0x00) 削除 削除 _ e (U+0115) @ (0x40) 削除 削除 ' g (U+0123) (0xc0) 削除 削除 ' O (U+01fe) (0xc0) 削除 削除 ^ o (U+01ff) (0xc0) 削除 削除 \ (U+00a5) (0xc0) 削除 (0xA1EF) (c) (U+00a9) (0x00) (0x00) 削除 (R) (U+00ae) (0x80) 削除 削除 --------------------------------------------------------------------- NKF 2.0.4 では誤変換が多く、特に 0x00 に変換されるのものは C 言語で 取り扱う際に不都合が生じていました。 NKF 2.0.5 ではほぼ理想的に変換できない文字が削除されていますが、 (c)だけは例外で 0x00 に変換されていました。 NKF 2.0.6 では、理想的にすべて削除されています。U+00A5 が 0xA1EF に 変換されるのも好ましい変換です。 以上、2.0.4, 2.0.5 にあった不具合は修正されたことを確認しました。 * ただし、このデータ以外はテストしていないので、このデータ以外で 不具合が生じないとは断言できません。 -- ===================================================================== 寺西 忠勝(TADAMASA TERANISHI) yw3t-****@asahi***** http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E