[fess-user 253] ファイルシステムクロールでの正規表現

Back to archive index

Takahiro Kikumoto takak****@gmail*****
2010年 6月 30日 (水) 10:26:59 JST


はじめまして、きくもとと申します。

fess 3.1.1 を利用しています。
ファイルシステムクロールの設定で、「クロール対象から除外するパス」で
拡張子 txt を除外するために

.*\.txt$

を指定したのですが、除外されませんでした。
一方で

.*txt$

を指定すると除外してくれます。
FileSystemIndexHelper.java 見ると、「クロール対象とするパス」「クロール対象から除外するパス」は
SystemHelper#encodeUrlFilter でエンコードされているかと思います(#20713対応)。
そうすると、org.seasar.robot.util.CharUtil#isUrlChar でバックスラッシュは false を返すため、
バックスラッシュはエンコードされてしまうのではないかと思います。
そうすると、正規表現 '\.' が S2Robot に渡されるときには意図したものとはことなった表現となり、
期待通りに動作しなかったのではないかと考えました。

ご確認いただき、対応をご検討いただければ幸です。
よろしくお願いいたします。




Fess-user メーリングリストの案内
Back to archive index