Webサイトを運用していくと、どうしても似通ったページが出来上がってしまいますよね。
同じようなページが複数あるとGoogleは「どのページを適切に評価したら良いの?」と誤認する可能性があります。
本来100の評価を受けるはずが、似たようなページが存在することで70の評価しか受けておらず、それが原因で上位表示していない可能性も秘めています。
こうした「うっかりミス」をなくす処理がURLの正規化です。
実際、重複コンテンツを整理しURLの正規化を正しく行って上位表示したケースもあります。
URLの正規化表現の前に、カニバリが起きているか?のチェック方法は、カニバリの発見方法!重複コンテンツを排除する方法を参照してください。
SEOの基礎や概念から知りたい人は、こちらもどうぞ!
【全てのWebサイトに共通】SEOの概念と基本的な理解を言えますか?
URLの正規化とは
同一の内容だが複数URLが存在する場合、ユーザーもGoogleも「どれが一番正しいURL?」と混乱する恐れがあります。
- http://hogehoge.com/green-dresses
- https://hogehoge.com/green-dresses
- http://www.hogehoge.com/green-dresses
- https://www.hogehoge.com/green-dresses
仮に、これら4URLが存在し、表示されるページ内容が一緒だったとしても、URL文字列が異なるので別のページとGoogleは判断し評価します。
何も指定がない場合はGoogleが「あ〜たぶんこれがURL正規かな!」と場合によっては誤認する可能性があるので注意が必要です。
同一のサイト内に、同じものを扱っていると思われるページが複数見つかった場合、Google では、最も完成度が高く有用であると判断したページを選び、そのページを正規と見なします。正規ページは最も高い頻度で定期的にクロールされます。重複ページについては、Google がサイトをクロールする負荷を軽減するため、より低い頻度でクロールされます。
Googleが正規化されたURLを判断する方法
そのため、Googleに対して「正規URLがどれページなのか」を通達しないと正しい評価を受けられないため、重複ページまたは類似ページの中から明示的に正規ページを選択することをおすすめします。
重複(カニバリ)コンテンツの見つけ方
重複コンテンツってどうやったら分かるの?
Googleがどういう判断をしているかは不明ですが、2つの方法で何となくでも把握することができます。
- サーチコンソールを活用して把握する
- site:検索をする
サーチコンソールを活用して把握する
1つ目は、サーチコンソールを活用した発見方法です。
サーチコンソールで「検索パフォーマンス」をクリックすると、指定期間内に検索結果に表示された「URL」「クエリ(キーワード)」「クリック率」「平均検索順位」が表示されます。
表示された「クエリ(キーワード)」をクリックし、タブを「ページ」に切り替えると、該当クエリに対して表示されたURLを見ることができます。
ココで、2つ以上のURLが表示されている場合は、「どちらのページを正しく評価・表示すれば良いかGoogleが困っているのかも?」と推察できます。
site:検索をする
2つ目は、検索窓に「site:ドメイン 調べたいキーワード」と打ち調べると、そのキーワードに対する回答らしきページが表示されます。
該当キーワードがコンテンツ内に存在するWebページだけを表示させたい場合は、「site:ドメイン “調べたいキーワード”」とすると、「調べたいキーワード」を含んだWebページを見ることができます。
URLを正規化する2つの方法
URLを正規化する主な方法は2つあります。
- canonicalで処理
- リダイレクト設定
(細かくいうともう少しありますが、一旦は2つの方法と認識してください。)
この2つの違いは、複数あるページを「同時にWebページとして存在させるか」「1つのページしか表示しないか」しかありません。
canocalでURLの正規化
canonicalで処理する場合は、複数のページがブラウザで閲覧できる状態ですが正規URLは1つしかないという状況です。
具体的な例では、ECサイトにおける色違いページが該当します。
色だけが異なっているだけで金額・大きさ・その他注意点は同じページ群だったとしましょう。
①黒いTシャツページ(https://hogehoge.com/shirt/black.html)
②白いTシャツページ(https://hogehoge.com/shirt/white.html)
③青いTシャツページ(https://hogehoge.com/shirt/blue.html)
この場合、ページごとの違いに大差がないので、どれか1つにURLの正規化をしたほうが良いとされます。仮に、黒いTシャツをURL正規化対象都する場合は、それぞれソースコードの<head>内に記述します。
<link rel="canonical" href="https://hogehoge.com/shirt/black.html">
これらを記載することで、「②白いTシャツページ」と「③青いTシャツページ」は「①黒いTシャツページ」が正規ページという意味合いになります。
今回は、あくまで分かりやすいような例にしましたが、Webサイトの構成や意図は私からは把握できませんので、必ずしもECサイトの商品詳細ページは同じようにしましょう!ということではありません。
伝えたいことは、「複数ページをユーザーに見せつつもGoogleからの評価を1つのページにしたい」時に使用します。
注意点
canonical処理でURL正規化する場合は、下記2つの注意点があります。
- URLは相対パスではなく絶対パスで記述
- URLが異なるモバイルページを正規化する場合、rel=”alternate”を使用
リダイレクト処理でURL正規化
canonicalは複数ページをユーザーに見せる手法に対して、リダイレクト処理は転送となるのでユーザーにもGoogleにも転送先のページしか認識できません。
①黒いTシャツページ(https://hogehoge.com/shirt/black.html)
②白いTシャツページ(https://hogehoge.com/shirt/white.html)
③青いTシャツページ(https://hogehoge.com/shirt/blue.html)
先ほどの例でいえば、「②白いTシャツページ」「③青いTシャツページ」のどちらにアクセスしても「①黒いTシャツページ」しか閲覧できません。
注意点
ページの転送設定は、.htaccessといったファイルを用いることがオーソドックスです。しかしながら、設定を誤ると思わぬページに転送することもあります。
これはcanonicalに記述するURLも同じですが、必ず「どこのページから」「どのページに転送設定」するかを確認しながら作業を心がけてください。
htaccessでリダイレクト処理するまとめ
URLの正規化は、Webサイト内のページ評価を正当に受けるための手法です。
もし思ったように順位が上がらないと思う場合は、正規化表現を疑ってみてください。