Googleは、クローラーと呼ばれる自動ボットを使ってウェブ上のコンテンツを発見し、インデックスに登録します。これらのクローラーは、ウェブページ、画像、動画など、様々なコンテンツを処理するために、それぞれ異なる種類のクローラーを割り当てており、サイトをただ取得するだけではありません。どのクローラーがサイトにアクセスしているかを把握することで、可視性の管理、クロールに関する問題のトラブルシューティング、そしてSEOの健全性維持に役立ちます。
Googleのクローラーについて知っておくべき理由
Googleがサイトを訪問する際、必ずしも同じクローラーを使用するわけではありません。代わりに、異なるクローラー(別名: Googlebot) は、Web ページ、画像、広告、動画、さらにはモバイル固有のバージョンを取得するコンテンツの種類に応じて異なります。
これらのクローラーを理解すると、次のことが可能になります。
-
あなたの サーバーログ より正確に
-
robots.txtファイルで重要なボットをブロックしないようにする
-
あなたの管理 クロールの予算 効率良く
-
クロールまたはインデックス作成の問題のトラブルシューティング
Googleの一般的なクローラー
ログに表示される最も一般的な Google クローラーは次のとおりです。
| クローラー名 | ユーザーエージェント文字列 | 目的 |
| Googlebot(デスクトップ) | Googlebotの/ 2.1(+ http://www.google.com/bot.html) | Web ページのデスクトップ バージョンをクロールします。 |
| Googlebot(スマートフォン) | Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML、Gecko など) Chrome/WXYZ Mobile Safari/537.36 (互換; Googlebot/2.1.XNUMX; +http://www.google.com/bot.html) | ウェブページのモバイル版をクロールします。Googleはモバイルファーストインデックスを採用しているため、これは現在最も重要なボットです。 |
| Googlebot 画像 | Googlebot-Image/1.0 | Google 画像検索用に画像をクロールします。 |
| Googlebot ビデオ | Googlebot-ビデオ/1.0 | Google ビデオ検索結果のビデオ コンテンツとメタデータをクロールします。 |
| Googlebotニュース | Googlebotニュース | Google ニュースに掲載するためにニュース記事をクロールします。 |
| AdsBot(Google 広告) | AdsBot-Google (+http://www.google.com/adsbot.html) | ランディング ページをクロールして、Google 広告の品質を確認します。 |
| Googlebot AdsBot モバイル | AdsBot-Google-モバイル | Google 広告の品質チェックのためにモバイル ランディング ページをクロールします。 |
| Googlebot アプリクローラー | Googlebot アプリ | アプリとアプリのコンテンツをクロールします (あまり一般的ではありませんが、アプリのインデックス作成のために存在します)。 |
SEOにおいて複数のクローラーが重要な理由
-
robots.txt で間違ったクローラーをブロックすると、ページ、画像、動画が検索結果に表示されなくなる可能性があります。
-
広告を掲載している場合はブロックしてください 広告ボット 広告品質スコアが低下する可能性があります。
-
Since モバイルファーストインデックス作成 がデフォルトとなり、サイトへのアクセスが保証されます。 Googlebot スマートフォン 重要です。
ボットがクロールできるものを制御する方法の詳細については、 robots.txtガイド.
リクエストがGoogleからのものであるかどうかを確認する方法
Googleが推奨 IPによるクローラーの検証 ユーザーエージェント文字列のみに頼るのではなく (ボットによって偽造される可能性があるため)。
ステップ:
-
IP アドレスの逆 DNS 検索。
-
ドメインが以下で終わることを確認してください
googlebot.comorgoogle.com. -
IP が Google に解決されることを前方確認します。