MENU
はっち
30代の2児のパパ。上場企業のWebマーケティング部署にて累計1,000以上のSEO施策を実行。SEO対策のセカンドオピニオンとして、躍動中。伴走型のコンサルも並行しています。

カニバリの原因!重複コンテンツを排除するURLの正規化方法

重複コンテンツはURL正規化で100%評価を受けよう

Webサイトを運用していくと、どうしても似通ったページが出来上がってしまいますよね。

同じようなページが複数あるとGoogleは「どのページを適切に評価したら良いの?」と誤認する可能性があります。

本来100の評価を受けるはずが、似たようなページが存在することで70の評価しか受けておらず、それが原因で上位表示していない可能性も秘めています。

こうした「うっかりミス」をなくす処理がURLの正規化です。

実際、重複コンテンツを整理しURLの正規化を正しく行って上位表示したケースもあります。

URLの正規化表現の前に、カニバリが起きているか?のチェック方法は、カニバリの発見方法!重複コンテンツを排除する方法を参照してください。

SEOの基礎や概念から知りたい人は、こちらもどうぞ!
【全てのWebサイトに共通】SEOの概念と基本的な理解を言えますか?

書いてあること

URLの正規化とは

同一の内容だが複数URLが存在する場合、ユーザーもGoogleも「どれが一番正しいURL?」と混乱する恐れがあります。

  • http://hogehoge.com/green-dresses
  • https://hogehoge.com/green-dresses
  • http://www.hogehoge.com/green-dresses
  • https://www.hogehoge.com/green-dresses

仮に、これら4URLが存在し、表示されるページ内容が一緒だったとしても、URL文字列が異なるので別のページとGoogleは判断し評価します。

何も指定がない場合はGoogleが「あ〜たぶんこれがURL正規かな!」と場合によっては誤認する可能性があるので注意が必要です。

同一のサイト内に、同じものを扱っていると思われるページが複数見つかった場合、Google では、最も完成度が高く有用であると判断したページを選び、そのページを正規と見なします。正規ページは最も高い頻度で定期的にクロールされます。重複ページについては、Google がサイトをクロールする負荷を軽減するため、より低い頻度でクロールされます。

Googleが正規化されたURLを判断する方法

そのため、Googleに対して「正規URLがどれページなのか」を通達しないと正しい評価を受けられないため、重複ページまたは類似ページの中から明示的に正規ページを選択することをおすすめします。

Google検索セントラル

重複(カニバリ)コンテンツの見つけ方

重複コンテンツってどうやったら分かるの?

Googleがどういう判断をしているかは不明ですが、2つの方法で何となくでも把握することができます。

  • サーチコンソールを活用して把握する
  • site:検索をする

サーチコンソールを活用して把握する

1つ目は、サーチコンソールを活用した発見方法です。

サーチコンソールで「検索パフォーマンス」をクリックすると、指定期間内に検索結果に表示された「URL」「クエリ(キーワード)」「クリック率」「平均検索順位」が表示されます。

表示された「クエリ(キーワード)」をクリックし、タブを「ページ」に切り替えると、該当クエリに対して表示されたURLを見ることができます。

ココで、2つ以上のURLが表示されている場合は、「どちらのページを正しく評価・表示すれば良いかGoogleが困っているのかも?」と推察できます。

site:検索をする

2つ目は、検索窓に「site:ドメイン 調べたいキーワード」と打ち調べると、そのキーワードに対する回答らしきページが表示されます。

該当キーワードがコンテンツ内に存在するWebページだけを表示させたい場合は、「site:ドメイン “調べたいキーワード”」とすると、「調べたいキーワード」を含んだWebページを見ることができます。

URLを正規化する2つの方法

URLを正規化する主な方法は2つあります。

  1. canonicalで処理
  2. リダイレクト設定

(細かくいうともう少しありますが、一旦は2つの方法と認識してください。)

この2つの違いは、複数あるページを「同時にWebページとして存在させるか」「1つのページしか表示しないか」しかありません。

canocalでURLの正規化

canonicalで処理する場合は、複数のページがブラウザで閲覧できる状態ですが正規URLは1つしかないという状況です。

具体的な例では、ECサイトにおける色違いページが該当します。

色だけが異なっているだけで金額・大きさ・その他注意点は同じページ群だったとしましょう。

①黒いTシャツページ(https://hogehoge.com/shirt/black.html)
②白いTシャツページ(https://hogehoge.com/shirt/white.html)
③青いTシャツページ(https://hogehoge.com/shirt/blue.html)

この場合、ページごとの違いに大差がないので、どれか1つにURLの正規化をしたほうが良いとされます。仮に、黒いTシャツをURL正規化対象都する場合は、それぞれソースコードの<head>内に記述します。

<link rel="canonical" href="https://hogehoge.com/shirt/black.html">

これらを記載することで、「②白いTシャツページ」と「③青いTシャツページ」は「①黒いTシャツページ」が正規ページという意味合いになります。

今回は、あくまで分かりやすいような例にしましたが、Webサイトの構成や意図は私からは把握できませんので、必ずしもECサイトの商品詳細ページは同じようにしましょう!ということではありません。

伝えたいことは、「複数ページをユーザーに見せつつもGoogleからの評価を1つのページにしたい」時に使用します。

注意点

canonical処理でURL正規化する場合は、下記2つの注意点があります。

  1. URLは相対パスではなく絶対パスで記述
  2. URLが異なるモバイルページを正規化する場合、rel=”alternate”を使用

リダイレクト処理でURL正規化

canonicalは複数ページをユーザーに見せる手法に対して、リダイレクト処理は転送となるのでユーザーにもGoogleにも転送先のページしか認識できません。

①黒いTシャツページ(https://hogehoge.com/shirt/black.html)
②白いTシャツページ(https://hogehoge.com/shirt/white.html)
③青いTシャツページ(https://hogehoge.com/shirt/blue.html)

先ほどの例でいえば、「②白いTシャツページ」「③青いTシャツページ」のどちらにアクセスしても「①黒いTシャツページ」しか閲覧できません。

注意点

ページの転送設定は、.htaccessといったファイルを用いることがオーソドックスです。しかしながら、設定を誤ると思わぬページに転送することもあります。

これはcanonicalに記述するURLも同じですが、必ず「どこのページから」「どのページに転送設定」するかを確認しながら作業を心がけてください。

htaccessでリダイレクト処理する

まとめ

URLの正規化は、Webサイト内のページ評価を正当に受けるための手法です。

もし思ったように順位が上がらないと思う場合は、正規化表現を疑ってみてください。

よかったらシェアしてね!
  • URLをコピーしました!
書いてあること