このレッスンを終えると、重複コンテンツとは何か、Google がそれを嫌う理由、重複コンテンツが検索ランキングに及ぼす影響、ウェブサイト上の重複コンテンツの種類、サイト上の重複コンテンツを見つける簡単な方法、重複コンテンツの問題を修正および防止するための実証済みの方法について理解できるようになります。
重複コンテンツとは何ですか?
重複コンテンツとは、インターネット上の複数の場所に同じコンテンツが存在することです。これは、自身のウェブサイト内だけでなく、複数のウェブサイト間で発生することもあります。
簡単な説明
ブログ記事を書いてウェブサイトに公開したと想像してみてください。そして、全く同じ記事をコピーして、サイト内の他の3つのページに公開したとします。これが重複コンテンツです。
あるいは、誰かがあなたのブログ記事をコピーして、許可なく自分のウェブサイトに公開したと想像してみてください。これも重複コンテンツです。
なぜそれが問題なのか
Googleの場合: Googleはユーザーに最も優れた、最も独創的なコンテンツを表示したいと考えています。同じコンテンツが複数の場所に存在する場合、Googleはどのバージョンを表示するかを選択しなければならず、これはGoogleの時間とリソースの無駄になります。
あなたのサイトの場合: Googleは重複コンテンツを見つけると、1つのバージョンだけをランキングに選び、他のバージョンは無視します。Googleがオリジナルではなく競合他社のコピーを選んだ場合、ランキングが下がる可能性があります。
ユーザー向け: 検索結果に同じ記事が5回も表示されるのは誰も望んでいません。重複コンテンツはユーザーエクスペリエンスを低下させます。
重複コンテンツの種類
重複コンテンツにはさまざまな形式があります。それぞれの種類を理解することで、適切な問題を解決できます。
内部重複コンテンツ
これは、あなた自身のウェブサイト内で重複したコンテンツです。
複数の URL に同じコンテンツがある
例: 商品は、異なる URL を持つ複数のページに表示されます。
yoursite.com/products/blue-shirt
yoursite.com/shop/clothing/blue-shirt
yoursite.com/mens/shirts/blue-shirt
3 つのページすべてに、まったく同じ製品の説明とコンテンツが表示されます。
なぜそれが起こるのか:
- 最低 サイト構造
- 同じページにアクセスする複数の方法
- 新しい URL を作成するためのフィルターと並べ替えのオプション
- 印刷用バージョン
- www 付き URL と www なし URL
影響: Googleは同じキーワードで競合する3つのページを認識し、そのうち1つを選び、残りは無視します。つまり、コンテンツの力は分散されてしまうのです。
定型文の内容
それは何ですか: サイト全体の多くのページに表示される繰り返しテキスト。
例:
- 50 個の類似製品に同じ商品説明が使用されている
- 各ページに著作権表示あり
- すべての記事に標準の免責事項
- テンプレートテキストがあらゆる場所で繰り返される
なぜそれが問題なのか: ページ コンテンツの 80% がページ間で同一である場合、残りの 20% が異なっていても、Google はこれらを重複として認識します。
解決策: 定型的な要素が残っている場合でも、メイン コンテンツが異なる各ページを一意にします。
URL内のセッションID
例:
yoursite.com/product?sessionid=12345
yoursite.com/product?sessionid=67890
yoursite.com/product?sessionid=24680
同じページですが、セッション ID が異なると、異なる URL が作成されます。
なぜそれが起こるのか: 一部の Web サイトでは、URL に追跡パラメータまたはセッション コードを追加します。
影響: Google は同じページに対して数十または数百の URL を認識します。
ファセットナビゲーション
電子商取引でよくあること:
yoursite.com/shoes
yoursite.com/shoes?color=red
yoursite.com/shoes?size=10
yoursite.com/shoes?color=red&size=10
各フィルターの組み合わせにより、同様のコンテンツを持つ新しい URL が作成されます。
何百ものフィルターの組み合わせにより、何千ものほぼ重複したページが作成されます。
外部重複コンテンツ
これはあなたのウェブサイトと他のウェブサイト間の重複コンテンツです。
スクレイピングされたコンテンツ
それは何ですか: 誰かがあなたのコンテンツをコピーし、許可なく自分のサイトに公開します。
それがどのように起こるか:
- コンテンツ窃盗ボットは自動的に記事をコピーする
- 競合他社が製品の説明を盗む
- コンテンツファームがあなたの作品を再公開する
- 自動スクレイピングツール
影響: 窃盗犯のサイトの権威が高ければ、盗んだコピーがあなたのオリジナルサイトよりも上位に表示される可能性があります。コンテンツ窃盗犯にトラフィックを奪われることになります。
シンジケートコンテンツ
それは何ですか: コンテンツを意図的に複数のサイトに公開します。
例:
- Mediumとブログに記事を公開する
- 5つの異なるサイトに同じ記事をゲスト投稿する
- ニュースサイトに配信されるプレスリリース
- メーカーが提供する製品説明
いつも悪いんですか? 適切な帰属表示と正規タグを使用して正しく実行すれば、必ずしもそうではありません。
コピーされた製品の説明
よくある問題: メーカーの標準製品説明を使用するオンライン ストア。
例: 同じ iPhone を販売している 1,000 の Web サイトはすべて、Apple の公式説明をそのまま使用しています。
結果: あなたの商品ページは、競合他社の999ページと見た目が同じです。Googleはそのうちの1ページを選びますが、おそらくあなたのページではないでしょう。
ライセンスとパートナーシップ
それは何ですか: パートナーまたはライセンスを受けたソースからのコンテンツを再公開する権限があります。
例:
- ニュースアグリゲーターによる記事の再掲載
- 企業コンテンツを共有するフランチャイズウェブサイト
- 提供されたコンテンツを使用するアフィリエイトサイト
課題: 許可があっても、Google はそれを重複コンテンツと見なします。
重複コンテンツがSEOに及ぼす悪影響
重複コンテンツはさまざまな SEO の問題を引き起こします。
ページの権限が希薄化
問題: 複数のページに同じコンテンツがある場合、バックリンクはすべてのバージョンに分割されます。
例: 3つのURLに同じコンテンツがあります。ある人はバージョンAにリンクし、別の人はバージョンBにリンクし、さらに別の人はバージョンCにリンクしています。
3 つのバックリンクを持つ 1 つの強力なページの代わりに、それぞれ 1 つのバックリンクを持つ 3 つの弱いページがあります。
結果: すべてのリンクが 1 つのバージョンを指している場合、どのページもそれほど上位にランクされません。
混乱させるGoogle
決定の問題: Google は検索結果に表示するバージョンを選択する必要があります。
Google が直面している疑問:
- どのバージョンがオリジナルですか?
- どのバージョンをランク付けすべきでしょうか?
- すべてのバージョンをインデックスする必要がありますか、それとも 1 つのバージョンだけでしょうか?
- 検索クエリに最も一致するバージョンはどれですか?
あなたの問題: Google が間違ったバージョンを選択する可能性、あるいは最悪の場合、どのバージョンも選択しない可能性があります。
無駄なクロール予算
クロール バジェットとは何ですか? Googleはサイトのすべてのページを毎日クロールするわけではありません。大規模なサイトでは「クロールバジェット」、つまり一定時間内にGoogleがクロールできるページ数が限られています。
廃棄物: Google が 100 個の重複ページのクロールに時間を費やすと、固有の価値あるページ 100 個を見逃してしまう可能性があります。
影響: 新しいコンテンツや更新されたコンテンツがインデックスに登録され、ランク付けされるまでに時間がかかります。
ペナルティ(稀ではあるが起こりうる)
手動アクション: Google がランキングを操作するために意図的に重複コンテンツを作成していると判断した場合、手動ペナルティを受ける可能性があります。
それが起こるとき:
- 他のサイトのコンテンツを意図的にスクレイピングする
- 同じ内容のドアウェイページを何百も作成する
- コンテンツのスピニング(自動書き換え)が不十分
重要: 重複コンテンツの問題のほとんどはペナルティにはつながりません。Googleは重複ページをランキングから除外するだけです。
重複コンテンツを見つける方法
これらの方法を使用して、サイト上の重複コンテンツを検出します。
方法 1: Google 検索
自分のサイトを確認してください:
検索演算子:
site:yoursite.com "exact phrase from your content"
例:
site:yoursite.com "this unique sentence appears in my article"
結果について サイトから複数のページが表示される場合は、内部に重複があります。
外部コピーを確認します:
ユニークなフレーズを検索:
"exact sentence from your article"
インターネット全体を検索するには、site: 演算子を削除します。
結果について 他の Web サイトが表示される場合は、その Web サイトがあなたのコンテンツをコピーした可能性があります。
方法2:Copyscape(無料版と有料版)
無料版:
- copyscape.comへアクセス
- ページのURLを入力してください
- 「Go」をクリック
- オンラインでコピーが存在するかどうかを確認する
制限事項: 無料版では一度に 1 ページのみチェックします。
プレミアムバージョン(月額5ドル):
- Copyscape Premiumに登録する
- 複数のURLを一括チェック
- 詳細なレポートを取得する
- 監視アラートを設定する
のためのベスト: 外部の重複コンテンツ(他者があなたをコピーしているもの)を見つける。
方法3:Google Search Console
重複コンテンツの問題を確認します。
- Search Consoleにログイン
- 「カバレッジ」レポートへ
- 「重複」の警告に注意する
- 影響を受けるページを見るにはクリックしてください
それが示すもの:
- Googleが重複とみなすページ
- インデックスから除外されるページ
- 正規タグの問題
どのページがランク付けされているかを確認します。
- 「パフォーマンス」レポートへ移動
- 「ページ」タブをクリック
- 同じキーワードでランク付けされている類似のURLを探す
危険信号: サイトの複数の URL が同じ検索用語に対して競合しています。
方法4:スクリーミングフロッグSEOスパイダー
使い方:
- Screaming Frog をダウンロード (500 URL まで無料)
- ウェブサイトのURLを入力してください
- 「開始」をクリックします
- 「コンテンツ」タブへ移動
- 「複製」セクションをクリック
見つかったもの:
- 重複したタイトル
- 重複した説明
- 重複したページコンテンツ
- 重複したH1タグ
メリット:
- サイト全体を一度にスキャンします
- パターンを識別する
- 分析用にデータをエクスポートする
方法5:サイトライナー
簡単なオンラインツール:
- siteliner.comへアクセス
- ウェブサイトのURLを入力してください
- スキャンが完了するまで待ちます(数分)
- 結果を確認する
それが示すもの:
- 重複コンテンツの割合
- 内部重複ページ
- ページ間で共通のコンテンツ
- 重複のある正確なページ
のためのベスト: 内部の重複問題の概要を簡単に説明します。
方法6:手動レビュー
よくある問題領域を確認してください:
製品ページ:
- 類似商品を5~10個開く
- 説明を比較する
- 同一のテキストを探す
ブログ投稿:
- 古い投稿を確認する
- 同じトピックを書き直したかどうか確認する
- コピー&ペーストセクションを探す
カテゴリページ:
- 類似カテゴリをチェック
- 繰り返しの説明を探す
- フィルターの組み合わせを確認する
重複コンテンツを修正する方法
重複コンテンツの種類に応じて適切なソリューションを選択します。
解決策1: 正規タグを使用する(ほとんどの場合に最適)
効能は・・・ 重複ページのどのバージョンが「メイン」バージョンであるかを Google に伝えます。
使用する場合:
- 複数のカテゴリページに同じ商品がある
- 印刷用バージョン
- 存在するはずの類似ページ
実装方法:
このコードを <head> 重複ページのセクション:
<link rel="canonical" href="https://yoursite.com/original-page" />
例:
同じ青いシャツを表示する URL が 3 つあります。
yoursite.com/products/blue-shirt (original)
yoursite.com/mens/blue-shirt (duplicate)
yoursite.com/clothing/shirts/blue-shirt (duplicate)
重複した 2 つのページに次の内容を追加します。
<link rel="canonical" href="https://yoursite.com/products/blue-shirt" />
元のページで、自己参照の正規表現を追加します。
<link rel="canonical" href="https://yoursite.com/products/blue-shirt" />
重要:
- 絶対 URL を使用する (https:// を含む)
- ランク付けしたいバージョンをポイントします
- 重複ページすべてに使用
解決策2: 301リダイレクト(不要なページの場合)
効能は・・・ あるURLを別のURLに恒久的にリダイレクトします。ユーザーと検索エンジンにはメインページのみが表示されます。
使用する場合:
- 不要になった重複ページ
- 古いURLは新しいURLに置き換えられました
- 両方を保持する理由がない複数のバージョン
実装方法:
Apache サーバーの場合 (.htaccess ファイル):
Redirect 301 /old-page https://yoursite.com/new-page
複数のリダイレクト:
Redirect 301 /products/old-shirt https://yoursite.com/products/blue-shirt
Redirect 301 /shop/old-shirt https://yoursite.com/products/blue-shirt
WordPressの場合: 次のようなプラグインを使用します:
- リダイレクト(無料)
- Yoast SEO(リダイレクトマネージャーを含む)
- ランク数学(リダイレクト機能を含む)
メリット:
- リンク権限を統合する
- クロールの無駄を削減
- よりクリーンなサイト構造
解決策3: Noindexタグ(ユーザーが必要とするページ用)
効能は・・・ ページをサイトに残しますが、Google にインデックスしないように指示します。
使用する場合:
- ありがとうページ
- 内部検索結果
- ユーザーが必要とするが、ランク付けすべきではないフィルターの組み合わせ
- ログイン/アカウントページ
実装方法:
追加 <head> セクション:
<meta name="robots" content="noindex, follow" />
その意味:
- noindex: 検索結果に含めない
- フォロー: このページのリンクを引き続きフォローします
使用例:
<!-- On search results page -->
<meta name="robots" content="noindex, follow" />
<!-- On thank you page -->
<meta name="robots" content="noindex, follow" />
<!-- On filtered pages -->
<meta name="robots" content="noindex, follow" />
重要: noindex と canonical を組み合わせないでください。1 つの解決策を選択してください。
解決策4:Search Consoleでのパラメータ処理
パラメータ付きの動的 URL の場合:
例題:
yoursite.com/products?sort=price
yoursite.com/products?sort=name
yoursite.com/products?sort=rating
解決策:
- Google Search Consoleへ移動
- 「従来のツールとレポート」をクリックします
- 「URLパラメータ」へ移動
- 「パラメータを追加」をクリックします
- パラメータ名を入力します(例:「sort」)
- Google に処理方法を知らせてください:
- 「ページコンテンツには影響しません」(並べ替えに推奨)
- 「ページネーション」
- 「コンテンツを絞り込む」
メリット: Google は、どのパラメータが重複を作成するかを理解し、適切に処理します。
解決策5: 統合して書き直す
実際の重複ページの場合:
同じトピックについて類似した記事を 3 つ書きました。
例:
- 「初心者のためのSEOのヒント10選」
- 「新しいウェブサイトのためのSEO対策」
- 「初心者のためのSEOアドバイス」
すべて同じ情報をカバーしています。
解決策:
- 最もパフォーマンスの高い記事を選択する
- 他者からの独自の情報を組み合わせる
- 包括的な記事を1つ作成する
- その他は削除または301リダイレクトしてください
メリット:
- 弱いページ3つではなく強いページ1つ
- ユーザーエクスペリエンスの向上
- Googleのランキングで圧倒的勝利
解決策6: Robots.txtでURLパラメータをブロックする
インデックスを付けたくないパラメータの場合:
例:
# Block session IDs
Disallow: /*?sessionid=*
# Block certain filters
Disallow: /*?color=*
# Block sorting parameters
Disallow: /*?sort=*
使用する場合:
- セッショントラッキングパラメータ
- 不要なフィルターの組み合わせ
- 印刷版
ホテルからのお願い これにより、クロールが完全に防止されます。控えめに使用してください。
解決策7: 独自のコンテンツを追加する
メーカーの説明がある製品ページの場合:
あなたの製品ページは競合サイト 500 社と同一です。
解決策:
独自の要素を追加します。
- あなた自身の製品レビュー(200語以上)
- カスタマーレビュー
- 使い方のヒント
- 類似製品との比較
- あなたの写真とビデオ
- FAQセクション
- サイズガイド
構造例:
[Manufacturer description] (20% of content)
Your review and tips (40% of content)
Customer reviews (20% of content)
FAQ (20% of content)
結果: これで、ページの 80% が独自性を持つようになり、競合他社との差別化に十分になりました。
解決策8:スクレイピングされたコンテンツを削除する
他の人があなたのコンテンツをコピーした場合:
ステップ1:盗難を記録する
- ページのスクリーンショット
- 出版日をメモする(あなたの出版日の方が早い)
- URLと証拠を保存する
ステップ2:ウェブサイトの所有者に連絡する
- 連絡先情報を見つける
- 削除を依頼する丁寧なメールを送信する
- あなたが原著者であることを証明してください
ステップ3: DMCA苦情を提出する 応答がない場合:
- ホスティングプロバイダにDMCA削除通知を提出する
- GoogleにDMCA苦情を提出する
- Google Search Consoleに報告する
ステップ4: Googleのツールを使う
- google.com/webmasters/tools/dmca-notice にアクセスしてください。
- 著作権侵害フォームに記入してください
- オリジナルコンテンツとコピーコンテンツのURLを提供する
- 送信
Google は次のようになります。 申し立てを確認し、コピーされたコンテンツを検索結果から削除する可能性があります。
重複コンテンツの防止
重複コンテンツの問題が発生する前に阻止します。
予防戦略1:敷地構造の計画
サイトを構築する前に:
URL構造を作成します: コンテンツ タイプごとに 1 つの正規 URL パターンを決定します。
製品の例: ✓ 良い例: yoursite.com/products/[製品名] ✗ 避けるべき例: 同じ製品への複数のパス
サイトアーキテクチャ:
- 明確なカテゴリ階層
- 重複するカテゴリはありません
- 各製品は1つのメインカテゴリーに
メリット: 最初から複数の URL を防止します。
予防戦略2:優先ドメインを設定する
www または www なしを選択します。
Search Console の場合:
- 設定に移動
- ドメイン設定を探す
- 優先ドメインを設定する
.htaccess ファイル内:
# Redirect non-www to www
RewriteEngine On
RewriteCond %{HTTP_HOST} ^yoursite\.com [NC]
RewriteRule ^(.*)$ https://www.yoursite.com/$1 [L,R=301]
メリット: すべてのリンクは 1 つのバージョンを指し、重複したコンテンツを回避します。
予防戦略3:オリジナルの製品説明を書く
メーカーの説明をコピーしないでください:
代わりに、次のように書きます。
- 製品に対するあなたの見解
- あなたが気づいた独自のメリット
- 特定の問題をどのように解決するか
- 代替案との比較
- 実際の使用シナリオ
時間節約のヒント: テンプレートを作成し、製品ごとにカスタマイズします。
- 機能(類似している場合もあります)
- あなたのレビュー(一意である必要があります)
- ユースケース(製品によって異なります)
予防戦略4:ページネーションにRel=”prev”とRel=”next”を使用する
ページ区切りのコンテンツの場合:
1 ページ:
<link rel="next" href="https://yoursite.com/blog?page=2" />
2 ページ:
<link rel="prev" href="https://yoursite.com/blog" />
<link rel="next" href="https://yoursite.com/blog?page=3" />
最後の3ページ目:
<link rel="prev" href="https://yoursite.com/blog?page=9" />
効能は・・・ これらのページが重複ではなくシリーズの一部であることを Google に伝えます。
注意: Google は 2019 年にこれを非推奨にしましたが、依然としてこれをシグナルと見なしています。
予防戦略5:シンジケーションガイドライン
コンテンツを他の場所で再公開する場合:
ステップ1: シンジケートする前に待つ まずサイトに公開し、Google がインデックスするまで 1 ~ 2 週間待ちます。
ステップ2: シンジケート版に正規タグを追加する 出版社に次の内容を追加するよう依頼します。
<link rel="canonical" href="https://yoursite.com/original-article" />
ステップ3: 著者情報を追加する あなたのサイトへの署名リンクを含めます。
ステップ4:逐語的なコピーを避ける 導入部分を修正したり、独自の要素を追加したりします。
予防戦略6:プリンタのバージョンをブロックする
印刷に適したページがある場合:
オプション1: インデックスを解除する
<meta name="robots" content="noindex, follow" />
オプション2: 正規タグを使用する 印刷バージョンをメイン ページに戻します。
オプション3: 印刷にCSSを使用する 個別のページの代わりに、CSS 印刷スタイルを使用します。
<link rel="stylesheet" href="print.css" media="print" />
別個の URL は必要ありません。
予防戦略7:定期的な監視
アラートを設定します。
Googleアラート:
- google.com/alerts にアクセスしてください
- コンテンツからユニークなフレーズを入力してください
- 頻度を「発生時」に設定する
- コンテンツがオンラインになったときにメールを受け取る
コピースケープ プレミアム:
- 自動監視
- 週次レポート
- 新しいコピーのアラート
毎月チェック:
- 重複問題については Search Console をご覧ください
- サイトライナースキャン
- 新しいページの手動レビュー
重複コンテンツは Google のペナルティの対象になりますか?
いいえ、重複コンテンツはほとんどの場合ペナルティの対象にはなりません。Googleは単純に1つのバージョンをランキングに選び、他のバージョンを除外します。コピーしたコンテンツで意図的にランキングを操作したり、何百ものドアウェイページを作成したりしない限り、ペナルティを受けることはありません。
すべてのページに同じサイドバーがある場合、重複としてカウントされますか?
いいえ。Googleは、ウェブサイトのテンプレートにヘッダー、フッター、サイドバー、ナビゲーションなどの繰り返し要素が含まれていることを理解しています。重要なのは、メインコンテンツ領域が各ページで異なることです。
Google Search Console では重複コンテンツの問題がすべて表示されますか?
Search ConsoleはGoogleが検出した重複コンテンツを表示しますが、すべてが表示されるわけではありません。インデックス作成に影響する問題に焦点を当てています。完全な内部監査にはScreaming FrogまたはSitelinerをご利用ください。複数のツールを組み合わせることで、最良の結果が得られます。