[fess-user 503] Re: 差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される件

Back to archive index

limol****@nifty***** limol****@nifty*****
2011年 6月 14日 (火) 21:43:47 JST


クニカタです。お世話になっております。

標記の件、クラスファイルを差し替えて試したところ、
差分クロールが想定どおりの動きになってました。
ありがとうございます!

4.1が本リリースになったら、切り替えようと
考えております。

----- Original Message -----
>Date: Sat, 30 Apr 2011 17:44:57 +0900 (JST)
>From: limol****@nifty*****
>To: fess-****@lists*****
>Subject: [fess-user 479] Re:
>	差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される件
>
>
>クニカタです。お世話になっております。
>
>標記の件、対応ありがとうございます!
>
>連休あけに試してみる予定にしてます。
>また報告します。
>
>----- Original Message -----
>>Date: Fri, 29 Apr 2011 17:30:41 +0900
>>From: Shinsuke Sugaya <shins****@yahoo*****>
>>To: fess-****@lists*****
>>Subject: [fess-user 478] Re:
>>	差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される件
>>
>>
>>菅谷です.
>>
>>遅くなってしまいましたが,
>>最新のスナップショットで対応しました.
>>4.0 のファイルを差し替えて動くかわかりませんが
>>以下のファイルを変更しました.
>>
>>webapps/fess/WEB-INF/classes/jp/sf/fess/action/admin/SearchListAction$1.clas
s
>>webapps/fess/WEB-INF/classes/jp/sf/fess/action/admin/SearchListAction.class
>>webapps/fess/WEB-INF/classes/jp/sf/fess/robot/FessS2RobotThread.class
>>
>>よろしくお願いいたします.
>>
>>shinsuke
>>
>>2011年4月10日20:27  <limol****@nifty*****>:
>>> クニカタです。お世話になっております。
>>>
>>> お返事ありがとうございます。
>>> 期待しております!
>>>
>>> ---
>>> 菅谷さんのすばやい対応と、的確なサポート等から、
>>> プロジェクトに対する意気込みみたいなものが
>>> 伝わってきますな。
>>> これからも、よろしくお願いいたします。
>>> 応援しています〜
>>>
>>> ----- Original Message -----
>>>>Date: Sun, 10 Apr 2011 10:47:58 +0900
>>>>From: Shinsuke Sugaya <shins****@yahoo*****>
>>>>To: fess-****@lists*****
>>>>Subject: [fess-user 463] Re:
>>>>       差分クロール:長い日本語ファイル名 URL が必ずインデックス更新される
>>>>>
>>>>
>>>>菅谷です。
>>>>
>>>>ご指摘いただきありがとうございます。
>>>>Solrのバージョンを上げれば、設定で回避できそうな気が
>>>>しますが、Fess 4.x では Fess 用の Solr プラグインなどで
>>>>対応できないかを検討したいと思います。ですので、申し訳
>>>>ありませんが少々お待ちください…。
>>>>
>>>>shinsuke
>>>>
>>>>
>>>>2011年4月8日20:06  <limol****@nifty*****>:
>>>>> クニカタです。お世話になっております。
>>>>>
>>>>> Fess4.0で差分クロールのテスト中、標記状況に遭遇しました。
>>>>>
>>>>> 前回クロール時からファイル内容は更新されていないのですが、
>>>>> 必ず毎回インデックスが登録されているファイルがいくつかあり
>>>>> ました。
>>>>> 共通している点は、長い日本語のファイル名ということでした。
>>>>>
>>>>> 調査したところ、該当の長いファイル名のものについては、
>>>>> 更新の有無を確認するためのSolrへの問い合わせ結果
>>>>> 件数が0(hits=0)で返るため、毎回登録されていました。
>>>>>
>>>>> 以下、ざっと確認した状況をまとめます。
>>>>> ----
>>>>> ●環境とクロール設定
>>>>> OS : Windows(XPと2003)
>>>>> 差分クロール : 有効
>>>>> インデックスの有効期限 : なし
>>>>> ファイルシステムクロール-ブラウザ : PC
>>>>>
>>>>> ●OKケースだった対象ファイル
>>>>> 内容の更新がない場合、再クロール対象とならない(Solrから「hits=1」が返る)
>>>>> 【ファイルパス】
>>>>> E:\DocumentFiles\FileNameLen\
>>>>> 022_■いうえおあいうえお■いうえおあいうえお■い.txt
>>>>> 【id】
>>>>> file:/E:/DocumentFiles/FileNameLen/022_%E2%96%A0%E3%81%84%E3%81%86%E3%81
>>>>> %88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81%8A%E2%96%A0%E3%81
>>>>> %84%E3%81%86%E3%81%88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81
>>>>> %8A%E2%96%A0%E3%81%84.txt;type=pc
>>>>>
>>>>> ●NGケースの対象ファイル
>>>>> 内容の更新がない場合でも、再クロール対象となってしまった(Solrから
>>>>> 「hits=0」が返る)
>>>>> 【ファイルパス】
>>>>> E:\DocumentFiles\FileNameLen\
>>>>> 023_■いうえおあいうえお■いうえおあいうえお■いう.txt
>>>>> 【id】
>>>>> file:/E:/DocumentFiles/FileNameLen/023_%E2%96%A0%E3%81%84%E3%81%86%E3%81
>>>>> %88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81%8A%E2%96%A0%E3%81
>>>>> %84%E3%81%86%E3%81%88%E3%81%8A%E3%81%82%E3%81%84%E3%81%86%E3%81%88%E3%81
>>>>> %8A%E2%96%A0%E3%81%84%E3%81%86.txt;type=pc
>>>>>
>>>>> ----
>>>>> ・上記OKケースより短い日本語ファイル名は、OK
>>>>> 上記NGケースより長い日本語ファイル名は、やはりNG
>>>>> となっていましたので、ここらへんが境界なのではないか
>>>>> と思ってます。
>>>>>
>>>>> ・solr管理画面から、「id:"〜該当の長いid〜"」
>>>>> で検索した場合も、結果0件となっていました。
>>>>> ので、Solr側の問題なんだと思ってます。
>>>>>
>>>>> Solr側の設定などで、回避できる方法をご存知で
>>>>> あればご教授いただきたく、よろしくお願いいたします〜
>>>>>
>>>>> _______________________________________________
>>>>> Fess-user mailing list
>>>>> Fess-****@lists*****
>>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>>>>
>>>>
>>>>_______________________________________________
>>>>Fess-user mailing list
>>>>Fess-****@lists*****
>>>>http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>>
>>> _______________________________________________
>>> Fess-user mailing list
>>> Fess-****@lists*****
>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>>
>>
>>_______________________________________________
>>Fess-user mailing list
>>Fess-****@lists*****
>>http://lists.sourceforge.jp/mailman/listinfo/fess-user
>
>_______________________________________________
>Fess-user mailing list
>Fess-****@lists*****
>http://lists.sourceforge.jp/mailman/listinfo/fess-user




Fess-user メーリングリストの案内
Back to archive index