Masayuki Shibata
mshib****@shima*****
2010年 1月 5日 (火) 19:34:18 JST
柴田@亀岡市です。 >AuthChallengeProcessor のログを除いた、最後の数行ログは >何になっているでしょうか? ... >しかし、その場合に3時間も返ってこないのは期待通り >ではない感じです・・・。「You have XXX unprocessed >documents.」のXXXがかなりの数になっていると別ですが。 >(数千など) あとは、「The execution time is XXXms.」の >XXX (Solrにドキュメントを送って処理した時間) が大体 >どれくらいかも気になります。 ファイル名 (URL) のみ伏せ字にしてますが、以下が生ログです。 #unprocessed documents は 400 台のようです。 2010-01-05 12:22:42,875 [Robot-20100105092954-1-5] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://hostname/svn/project/XXXXXXXXXXXXXX/ 2010-01-05 12:22:42,890 [Robot-20100105092954-1-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - digest authentication scheme selected 2010-01-05 12:22:42,921 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sent 11 documents. The execution time is 593ms. 2010-01-05 12:29:36,640 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Stopped all crawler threads. You have 497 unprocessed documents. 2010-01-05 12:29:43,750 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sending 11 document to a server. 2010-01-05 12:29:43,906 [IndexUpdater] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 12:29:44,250 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sent 11 documents. The execution time is 500ms. 2010-01-05 12:36:48,125 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Stopped all crawler threads. You have 487 unprocessed documents. 2010-01-05 12:49:21,562 [http-8080-2] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 12:49:25,750 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 13:27:47,578 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sending 11 document to a server. 2010-01-05 13:27:47,953 [IndexUpdater] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 13:27:48,593 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sent 11 documents. The execution time is 1015ms. 2010-01-05 14:01:57,734 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Stopped all crawler threads. You have 477 unprocessed documents. 2010-01-05 14:08:13,906 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 14:08:17,281 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 14:11:18,875 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sending 11 document to a server. 2010-01-05 14:11:19,406 [IndexUpdater] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 14:11:20,187 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sent 11 documents. The execution time is 1312ms. 2010-01-05 14:32:07,828 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 14:32:12,218 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected 2010-01-05 14:35:34,312 [http-8080-5] INFO org.apache.commons.httpclient.auth.AuthChallengeProcessor - basic authentication scheme selected ... (同じ内容のログが20行ほど続く) >あとは、Tomcat の logs/catalina.out に >何か出ていないでしょうか? 黙り込む直前 14:11:20 頃まで 「情報: {add=[http://...」という ログが出ているのですが、最後の3回分がかなり時間間隔が開いてい ます。 それ以前は1〜2秒間隔だったのが、最後の3つの間隔は1時間程度、 (その1つ前とは7分くらい) ですので、急激にのろくなった感じで 止まっています。 そのログの間に、クロール実行中の確認や、生きているかの確認のた めの検索のログがはさまっているくらいで、特に不審なものは見あた りません。 少しずつ設定をチューニングしているので同じ条件ではありませんが 以前 6000 を少し越えるところまで溜まった段階で時間切れで手動停 止したことはありますので、何か条件が異なるのだと思います。