[Kazehakase-devel 1728] Re: URL補完

Back to archive index

Hiroyuki Ikezoe poinc****@ikezo*****
2004年 11月 7日 (日) 01:33:45 JST


zoeです。

On Sat, 23 Oct 2004 21:24:23 +0900 (JST)
Hidetaka Iwai <tyuyu****@sings*****> wrote:

> あと、egg_regex なのですが、egg_regex_new() で EGG_REGEX_CASELESS を付
> けて、なおかつ egg_regex_match() で regex に UTF-8 が含まれていると、
> マッチングがおかしくなるように思います。検証用のコードを書くつもりだっ
> たのですが、あまり上手くいきませんでした orz
> 
> とりあえず http://bozu.sytes.net/~tyuyu/egg_regex_test-0.0.1.tar.gz
> に置いておきますので、
> 
>  ./egg_regex_test i 
> 
> などとして適当な文字列を引数に渡してやれば、何となくおかしそうだな、と
> いうのはわかるかもしれません。

遅ればせながら試してみました。
.
/egg_regex_test i
./egg_regex_test io

で、 
http://dl.gna.org/kazehakase
にマッチしてしまうのがおかしいのだと思いますが、実際にMigemoから帰ってく
る正規表現が

% migemo -d /usr/share/migemo/migemo-dict -t egrep
io
[Sι庵魚菴]|io|I/O|io|いお|アイ(オワ|ソメ)|イ(オ|音便)|伊(織|王島
)|異音|医王寺|井岡|五百枝|入出力|硫黄

このようになってて、この「S」にマッチしているんだと思います。Sに『io』と
いう発音が含まれる読み方があるのかどうなのかは分かりません。



Kazehakase-devel メーリングリストの案内
Back to archive index