[LE-talk-ja 259] Re: 投稿者トップ30

Back to archive index

KIMURA Koichi kbk****@kt*****
2006年 5月 30日 (火) 00:40:04 JST


木村です。

初投稿がこれというのもなんなのだろうかと思いますが(^^;

Hiro Yoshioka さんは書きました (2006/05/29 23:48):

> それよか、びっくりしたのはgrepが異様に遅いのですが
> LANG=ja_JP.UTF-8 だといけないみたいで、
> 
> $ time egrep '^From:' /tmp/le.txt|wc
>     258    1521   12538
> 
> real    0m32.285s
> user    0m32.376s
> sys     0m0.024s
> $ time LANG=C egrep '^From:' /tmp/le.txt|wc
>     258    1521   12538
> 
> real    0m0.156s
> user    0m0.151s
> sys     0m0.005s
> 
> 200倍違うんですけど、そーゆーもんなんすか?>grep

GNU grep でしょうか? だとしたらそういうものです。
たびたび「バグだろう」とレポートされている代物です。

日本語環境でなくても、en_US.UTF-8 とか de_DE とかでも
なります。以前profileとって少し調べたのですが、wchar_tへの
変換もそうですが、動的にDFAを生成しているのが(マルチバイト文字
対応ルーチンのときに)かなり重いみたいです。

-- 
木村浩一
  I thought what I'd do was, I'd pretend I was one of those deaf-mutes.
  mail kbk****@kt*****
	web  www.kt.rim.or.jp/~kbk/zakkicho/
	     homepage3.nifty.com/farstar/




Legacy-Encoding-talk-ja メーリングリストの案内
Back to archive index