KIMURA Koichi
kbk****@kt*****
2006年 5月 30日 (火) 00:40:04 JST
木村です。 初投稿がこれというのもなんなのだろうかと思いますが(^^; Hiro Yoshioka さんは書きました (2006/05/29 23:48): > それよか、びっくりしたのはgrepが異様に遅いのですが > LANG=ja_JP.UTF-8 だといけないみたいで、 > > $ time egrep '^From:' /tmp/le.txt|wc > 258 1521 12538 > > real 0m32.285s > user 0m32.376s > sys 0m0.024s > $ time LANG=C egrep '^From:' /tmp/le.txt|wc > 258 1521 12538 > > real 0m0.156s > user 0m0.151s > sys 0m0.005s > > 200倍違うんですけど、そーゆーもんなんすか?>grep GNU grep でしょうか? だとしたらそういうものです。 たびたび「バグだろう」とレポートされている代物です。 日本語環境でなくても、en_US.UTF-8 とか de_DE とかでも なります。以前profileとって少し調べたのですが、wchar_tへの 変換もそうですが、動的にDFAを生成しているのが(マルチバイト文字 対応ルーチンのときに)かなり重いみたいです。 -- 木村浩一 I thought what I'd do was, I'd pretend I was one of those deaf-mutes. mail kbk****@kt***** web www.kt.rim.or.jp/~kbk/zakkicho/ homepage3.nifty.com/farstar/