[fess-user 331] ファイルシステムクロール時のrtfドキュメントの文字化けについて

Back to archive index

lvisd****@gmail***** lvisd****@gmail*****
2010年 8月 9日 (月) 23:30:58 JST


お世話になります。
加納です。

rtfドキュメントに対して、
ファイルシステムクロールしたところ、
"digest"が文字化けするようです。

【solr admin検索結果】

「Microsoft Word 97-2003 文書」
<str name="cache">test TEST テスト てすと</str>
<str name="digest">...test TEST テスト てすと</str>
<str name="mimetype">application/msword</str>
<str name="site">c:\docs\rtf\test.doc</str>

⇒OK

「Word 97-2003 & 6.0/95 -RTF (*.doc)」
<str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
<str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
<str name="mimetype">application/msword</str>
<str name="site">c:\docs\rtf\test_rtf.doc</str>

⇒NG

「リッチ テキスト形式 (RTF) 文書」
<str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
<str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
<str name="mimetype">application/rtf</str>
<str name="site">c:\docs\rtf\test.rtf</str>

⇒NG

【利用環境】
OS:WindowsXP-SP3
Java:1.6.0_20
fess:3.1.1/3.1.3(SNAPSHOT)
MS-WORD:2002/2003

以下のサイトで紹介されているように、
Wordから出力されるRTFの文字列が、
Unicode化されていないのが原因でしょうか?

【参考】
<http://a-gamyl.hp.infoseek.co.jp/Java/RTFio/RTFio_java.html>

以上、よろしくお願い致します。
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
다운로드 



Fess-user メーリングリストの案内
Back to archive index