포럼: 【GitHubに移行しました】サポート (Thread #40469)

検索結果(ファイル名)の文字化け Webクロール (2019-03-03 04:27 by Toshio #82643)

お世話になります。内山と申します。よろしくお願いします。
FESS 12.4.3 でウェブサイト全文検索システムの構築調査をしています。
対象サイトは Windows サーバーで IIS です。ファイル名は S-JIS です。
Web クロールして、検索を結果を表示させると、PDF、エクセル、ZIP
などのファイル名が文字化けして表示されます。
解決を試みました。WEB-INF/classes に s2robot_transformer.dicon と s2robot_transformer_basic.dicon を作り
その中に、<property name="encoding">"Shift_JIS"</property> と書いてみましたが、影響なしです。
また、transformer.xml と transformer_basic.xml に<property name="encondig">"Shift_JIS"</property>と
書いてみましたが、これを書くと clawrer が起動後すぐに fess-clawrer.log に java の exception を出力して
止まるようです。
どのようにしたら、パスのエンコーディングが Shift_JIS なので、UTF-8 に変換するように設定できるでしょうか。
ご教示いただければ幸いです。

Reply to #82643×

You can not use Wiki syntax
You are not logged in. To discriminate your posts from the rest, you need to pick a nickname. (The uniqueness of nickname is not reserved. It is possible that someone else could use the exactly same nickname. If you want assurance of your identity, you are recommended to login before posting.) Login