Hiroyuki Ikezoe
poinc****@ikezo*****
2004年 11月 7日 (日) 01:33:45 JST
zoeです。 On Sat, 23 Oct 2004 21:24:23 +0900 (JST) Hidetaka Iwai <tyuyu****@sings*****> wrote: > あと、egg_regex なのですが、egg_regex_new() で EGG_REGEX_CASELESS を付 > けて、なおかつ egg_regex_match() で regex に UTF-8 が含まれていると、 > マッチングがおかしくなるように思います。検証用のコードを書くつもりだっ > たのですが、あまり上手くいきませんでした orz > > とりあえず http://bozu.sytes.net/~tyuyu/egg_regex_test-0.0.1.tar.gz > に置いておきますので、 > > ./egg_regex_test i > > などとして適当な文字列を引数に渡してやれば、何となくおかしそうだな、と > いうのはわかるかもしれません。 遅ればせながら試してみました。 . /egg_regex_test i ./egg_regex_test io で、 http://dl.gna.org/kazehakase にマッチしてしまうのがおかしいのだと思いますが、実際にMigemoから帰ってく る正規表現が % migemo -d /usr/share/migemo/migemo-dict -t egrep io [Sι庵魚菴]|io|I/O|io|いお|アイ(オワ|ソメ)|イ(オ|音便)|伊(織|王島 )|異音|医王寺|井岡|五百枝|入出力|硫黄 このようになってて、この「S」にマッチしているんだと思います。Sに『io』と いう発音が含まれる読み方があるのかどうなのかは分かりません。