[Nkf-dev 27] Re: nkf 2.0.6 リリース

Back to archive index

Tadamasa Teranishi yw3t-****@asahi*****
2006年 3月 28日 (火) 09:15:05 JST


寺西です。

以前、「NKF における UNICODE マッピングの問題」を指摘しましたので、
その確認を nkf 2.0.6 で行いました。

UNICODE -> EUC-JP に変換した時に次のような変換が行われます。 

                  NKF 2.0.4     NKF 2.0.5    NKF 2.0.6
I   (U+0130)   (0x00)    削除     削除
' 
y   (U+00fd)   (0xc0)    削除     削除
-D  (U+00d0)   (0xc0)    削除     削除
_
E   (U+0114)   (0x00)    削除     削除
_
e   (U+0115)   @ (0x40)   削除     削除
'
g   (U+0123)   (0xc0)    削除     削除
'
O   (U+01fe)   (0xc0)    削除     削除
^
o   (U+01ff)   (0xc0)    削除     削除

\   (U+00a5)   (0xc0)    削除     (0xA1EF)
(c) (U+00a9)   (0x00)    (0x00)    削除
(R) (U+00ae)   (0x80)    削除     削除

---------------------------------------------------------------------

NKF 2.0.4 では誤変換が多く、特に 0x00 に変換されるのものは C 言語で
取り扱う際に不都合が生じていました。

NKF 2.0.5 ではほぼ理想的に変換できない文字が削除されていますが、
(c)だけは例外で 0x00 に変換されていました。

NKF 2.0.6 では、理想的にすべて削除されています。U+00A5 が 0xA1EF に
変換されるのも好ましい変換です。 

以上、2.0.4, 2.0.5 にあった不具合は修正されたことを確認しました。


* ただし、このデータ以外はテストしていないので、このデータ以外で
不具合が生じないとは断言できません。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-****@asahi*****
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E




nkf-dev メーリングリストの案内
Back to archive index