hamada
bungu****@leo*****
2004年 7月 13日 (火) 10:58:26 JST
こんにちわ。 On Tue, 13 Jul 2004 09:13:38 +0900 TAMURA Toshihiko <tamur****@bitsc*****> wrote: > もしよろしければ、この問題に関心のあるみなさんに > 上のような情報を出してもらえれば、YSTのインデックス化の > 傾向をつかむ参考になるのではないかと思います。 ということで、恥ずかしながら当方も末席を汚させて頂きます(~_~;) ●サイトの概要 商品点数 : 1500弱 カテゴリー階層 : 2〜6階層(商品分野により異なる) 商品一覧ページ : あり mklist トップ → 商品リスト → 商品詳細 mklist2 トップ→メーカー一覧→メーカー毎商品→商品詳細 o カテゴリー階層: mklist :1階層 (トップから商品詳細まで2回リンク) mklist2:2階層 (トップから商品詳細まで3回リンク) o リストページ中の商品数: 平均50 (←mklist2によるもの) 「商品一覧ページ」はmklist/mklist2を使用して静的に生成したHTMLファイル。 cronで日に3度作り直している。 ・mklist→全商品一覧。埋め込みリンク数約4,000 ・mklist2→メーカー毎商品一覧&全メーカー一覧 その他AllProductsも併設。 サーチエンジン対策のURLを使用: true Spiderkiller : true (が、昨日入れたばかりなので未だ結果には関係ないと思われる:^^;) ●インデックス化されているページ数 Google : 4200ページ YST Japan: 400ページ (商品詳細のインデックス化は約15%) ざっとこんな感じでしょうか? 商品数に比してGoogleのインデックスが多いのは、 ・各段階の商品一覧がインデックスされている ・AllProductsとmklistを併用している 等の理由が大きいようです。 たとえば同一の商品名が /catalog/default.php/cPath/23_166_123 というカテゴリ商品一覧に加え /catalog/list/list00047.html /catalog/list.html /catalog/all_products.php という各レベル商品一覧や /catalog/product_info.php/products_id/288 (↑旧mklist/AllProductsによるリンク) /catalog/product_info.php/cPath/23_166_123/products_id/288 (↑mklist/mklist2によるリンク) /catalog/product_info.php/manufacturers_id/47/products_id/288 (↑メーカーからリンクを辿った場合) として別々にインデックスされている→このような例がかなり沢山ありまして、 「全商品よりもインデックス数のほうが多い」という奇妙な状況に。 (まぁGoogleは同一サイトの検索結果をまとめちゃうんで、沢山インデックスさ れててもあまり大したメリットはない) ちなみにYSTでは殆どダブリがありません。「絶対数が少ないので確率論的にダ ブりにくい」とも言えますが。 また、YSTにインデックスされている中に商品詳細ページ(product_info.php)の インデックスはあまり多くなく、カテゴリの一覧ページ(default.php/cPath)が 目立つような気がします。 これは、もしかすると「YSTのSERPsにはリンク集が一杯出てくる」ことと何か関 連があるのかもしれません。(=YSTはリンクが一杯書いてあるページが好き?! 仮説) > また、ご意見や新しい情報があれば教えてください。 当方が結構気にしているものに「トップページの更新頻度」があります。 osCがトップな場合はあんまり関係ないのかもしれませんが、当方はそれより上 位にコンテンツを置いてますので、そちらのほうの更新頻度によってフレッシュ クロールを呼び込める可能性が増しそうかな〜、とか。 まぁ、実際にはSSIで日付を表示し、(s)HTMLファイルのパーミッションを755に しとけばいいだけらしいんですけど(^_^;) PHPで動作するosC自体は「If-Modified-Since」に対して常に「200 OK」を返す みたい→Last-Modifiedを返さないのが(「未対応」と判定されそうで)ちょっ と気になりますけど、基本的には大丈夫かな?と。 http://de3.php.net/manual/ja/function.header.php とか見ると header( "Last-Modified: " . 適当な時間); とか書いとけばLast-Modifiedを返せなくもないみたい→「常に30分前に更新さ れた事にする」とか出来なくもないみたいなんですが。 常に先頭で呼ばれるapplication_top.phpに書いとけばいいのかなぁ?? (実際にやる気はあまりないのでかなりいい加減:^^;) はまだ