avatar
SEO初心者🔰
SEOにおける重複コンテンツって何のことなのか知りたい。他サイトのテキストコンテンツをそのまま盗用することとの違いは何なのか知りたい。

上記のような疑問に答えるべく、本記事では以下について説明します。

本記事で伝える内容

① SEOにおける重複コンテンツについて
② Googleに重複コンテンツと認識される基準
③ 重複コンテンツのリスク
④ 重複コンテンツの確認方法
⑤ 重複コンテンツの対策方法

本記事を書く僕は、SEO歴が10ヶ月ですが、Webマーケティング会社でのアナリストとして30サイトの分析・調査・戦略策定に従事し、現在は事業会社でマーケターをしています。SEOの重複コンテンツに関する調査・施策実行まで携わった経験があります。

本記事で説明する重複コンテンツについて理解することにより、重複コンテンツのリスクを軽減し、記事コンテンツからの安定的な流入が見込めます。

ページコンテンツ

重複コンテンツとは?

重複コンテンツとは、コピーコンテンツとも呼ばれ、Webサイトのタイトル、ボディの内容が他コンテンツと同様のものであるとGoogleなどの検索エンジンに判断される現象を指します。

重複コンテンツは意図的に似せて作る人もいれば、意図せずに生成されることがあるので注意が必要です。

正式にGoogleのサポートにおいても以下のように定義がなされています。

重複するコンテンツとは、ドメイン内または複数ドメインにまたがって存在する、他のコンテンツと完全に同じであるか非常によく似たコンテンツのブロックを指します。

引用元: 重複コンテンツGoogle Search Console ヘルプ

重複コンテンツは、主に2種類あり、ドメイン内かドメイン外で扱いが異なります。これら2つについても説明していきます。

ドメイン内の重複コンテンツ

ドメイン内の重複コンテンツとは、自身の運営サイト内に同じようなコンテンツが存在してしまっている状況を言います。これらのコンテンツは具体的には、以下のようなケースがあります。自身の運営サイトがいずれかに当てはまる場合には必ず対策をしましょう。

ドメイン内の重複コンテンツの具体例

・定型文が繰り返し使用されているページ(ブログやコンテンツ系サイト)
・カテゴリ一覧ページやタグ一覧ページ(WordPressなどのCMSの機能)
・1ページに複数のアドレスでアクセスできるページ(ECサイトなどのパラメータが付与されるもの)
・PCとSPで別々のURLのページ

Webサイトを運用していると、コンテンツを大量に投下することが優先になりがちで、このような小さな点に気付かずに運用してしまいがちです。各ページに対して行える対策については後述しますが、自身のサイトにリスクがあることは抑えておきましょう。

ドメイン外の重複コンテンツ

ドメイン外の重複コンテンツとは、自身の運営サイト以外のドメインで同じようなコンテンツが存在してしまっている状況を言います。

ドメイン外の重複コンテンツの具体例

・商品説明欄の記述をメーカー公式サイトから引用しているページ
・他サイトのコンテンツを丸パクリしたページ …

重複コンテンツのリスク

Webページに重複コンテンツが存在するとWebサイトの運用上で重大なリスクが内包します。

リスク1: 検索結果に表示されなくなる

Googleなどの検索エンジンでは、ユーザーが最も求める検索結果を返すことが重要なポリシーとなっています。そのため、1つの検索クエリに対して1つの検索結果を出力するようにプログラムが組まれています。

もし、他サイトにもあるような重複コンテンツ自社サイトで制作したとしても、他サイトコンテンツの方が質が高ければ、自社サイトのコンテンツの正規ページが他社サイトページと見なされ、自社サイトのページが検索結果として表示されなくなります。

リスク2: ペナルティーと判断される

記事コンテンツを制作するときに、故意に他サイトコンテンツの内容を真似したような記事にしてしまうと、Googleから低品質ページばかりを集めた悪質なサイトであると判断され、ペナルティー対象と見なされることが起こりえます。

ペナルティーと見なされると、特定のキーワード領域の検索順位が一気に下落し、一気に流入が減少します。少しぐらい重複コンテンツが確認されるだけなら、Googleも許してくれますが、重複コンテンツが一気に増加すると、危険です。

リスク3: ページ評価が分散し、被リンクの価値が下がる

同じドメイン内に重複コンテンツが存在すると、Googleはそれらのページに同じだけクローリングリソースを分散投入するため、評価が分散されます。

例えば、1つのページに対しての評価が100だとしたら、重複コンテンツが3ページあった場合には、各ページに対して33.3%の評価が注がれることになります。

この場合、これらの各ページが被リンクを獲得しても評価は分散されることもあり、SEOで上位表示を狙う場合の大きな足かせになりかねないです。

重複コンテンツの基準

Webサイトに大量のコンテンツを投下していると、以下のようなことを不安に感じるのではないでしょうか?

avatar
SEO初心者🔰
これは重複コンテンツと見なされてしまうのだろうか…. Googleが判断する境界線を知りたい…

重複コンテンツと見なされる基準を知っておけば、事前に対策が取れるようになるはずです。

ただし、WebページがGoogleから重複コンテンツと見なされる基準は存在するのですがGoogleしか知りません。ここでは、重複コンテンツと見なされないように最低限のことを説明します。

ポイント1: 盗用、コピペは完全にアウト

Webサイトを運用する上で自身が作ったコンテンツが他サイトのコンテンツと似通ったものになることは十分起こり得ます。これはGoogleもある程度は同じ見解です。

しかし、ただコピペしてサイトに掲載したようなコンテンツの場合はGoogleもわかります。このようなコンテンツを投下した場合には、すぐにペナルティー対象となる可能性があることは認識しておくべきです。

ポイント2: 助詞や語句の位置変更もアウト

「て・に・お・は」などの助詞を入れ替えたようなコンテンツも完全にアウトです。また、コピーした語句を入れ替えたようなコンテンツも重複コンテンツと見なされる可能性が大いに高いので気をつけましょう。

例えば以下をご覧ください。

元の文章・・・個人的に昨日のWebマーケティング勉強会が楽しかった。
変更した文章・・・昨日のWebマーケティング勉強会は個人的に楽しかった。

これらの文章は完全に同じと見なされますwww
しっかりと自分で文章を書くことを心がけましょう。

重複コンテンツを確認方法

実際に重複コンテンツがWebサイトに存在するならば事前に知りたいと思いますよね。Webページの重複コンテンツを確認する方法を紹介します。

方法1: Google検索して確認

確認したいWebページ内のテキストを何十文字かコピーして、検索エンジンで検索をした時に、自社サイト以外のサイトが表示された場合には、自社サイトが重複コンテンツと見なされているリスクがあります。

方法2: コピーディテクトツールで重複率を確認

僕はWebディレクターとしてWebサイトのブログ記事のディレクションをするのですが、ライターさんが書いた記事が重複コンテンツか否かを確かめる時によく利用しているのが無料ツールであるCopyContentDetectorです。

このツールを使うことで、Webサイトのコンテンツの重複チェックが無料でできます。無料プランでも最大4000文字までの調査が可能となっているので、良心的です。

テスト結果として、「類似度」「一致率」などをツールの独自のロジックで算出してくれるので、確認するにはうってつけのツールです。

重複コンテンツの対策方法

運営サイトが重複コンテンツの疑いがある場合には、相応の対策が必要となります。重複コンテンツはいくつか種類があるため、それぞれのケースに合わせた適切な対策を取る必要があります。以下では、重複コンテンツに対する具体的な対策方法について説明します。

URLの正規化

1ページに複数のアドレスでアクセスができるようなページが存在している状況に対して、URLの正規化を行い、一意のURLを検索エンジンに読み込ませる必要があります。URLの正規化は主に「301リダイレクト」か「canonical」の2つの方法で実装することが可能です。

301リダイレクトの実装

1つ目は301リダイレクトによるURLの正規化の方法について説明します。301リダイレクトとは、特定のWebページにアクセスがあったとしても、指定した他のページに意図的に遷移させることができる機能です。

例えば、本ブログではトップページが「https://webkirin.info」なのですが、以下のように複数のページが存在してしまうことがあります(もちろんいずれもコンテンツは全く同じです)。

・https://webkirin.info/・・・「/(スラッシュ)」がつくページ
・https://www.webkirin.info/・・・「www」がつくページ
・https://webkirin.info/index.html・・・「/index.html」がつくページ

このような場合には、これら3種類のページにアクセスがあったときに301リダイレクトで「https://webkirin.info」に強制的にリダイレクトを行うことで、「https://webkirin.info」ページを正規ページと認識させることが可能となります。

関連記事:
SEOとリダイレクトについて徹底解説します!!

canonicalの実装

2つ目はcanonicalによるURLの正規化の方法について説明します。canonicalとは、検索エンジンに対して、正規のURLとして認識させたいURLを指定することでクローラーに1意のURLと認識させることのできるhtmlの記述法です。

関連記事:
canonicalタグの使い方とURLの正規化について徹底解説

定型文を使用しないようにする

ブログやコンテンツ系サイトではよく定型文を使用する人を見かけますが、このような定型文も使用しないようにし、なるべく全ての記事で新しい情報を提供するように心がけることが必要です。

また、同じドメイン内で他のページの内容を引用するようなことはせず、項目に関する要約を添えてそれ以外の細かな情報は詳細ページの内部リンクから参照するようにしてもらう構成が一番いいと思われます。

アノテーションの実装

アノテーションとは、PCやスマホ用で同じコンテンツを持つWebサイトの場合に、検索エンジンに各端末ごとに異なるURLが存在することを検索エンジンに伝えるための設定です。アノテーションの設定は以下のように行います。

① alternate属性の付与

PC用ページ内のhtmlに、「link rel = “alternate”」を付与することで、PCサイト以外にスマホ用のサイトがあることを検索エンジンに伝えることができます。

② canonical属性の付与

スマホ用ページ内のHTMLに、PC用URLに対して「link rel = “canonical”」を付与します。

noindexの実装

同じサイト内で重複コンテンツの疑いがある場合には、正規URLではないコンテンツにnoindexの設定をすることでGoogleからインデックスされず、正規URLにしたいページを適切にGoogleにインデックスさせることができます。

コンテンツの削除

これは滅多にやりませんが、通常はnoindexで対応しますが、コンテンツ自体を削除することで、重複コンテンツのリスクを根本的から無くすことになり、検索クエリのヒットLPとしてGoogleに認識されることが可能かと思います。

外部サイトに記事を提供している場合

外部サイトに記事を提供する際にも重複コンテンツのリスクがあります。このような場合には、記事を提供するサイトに自社サイトに向けたcanonicalの実装し、自社ページが正規URLであることをGoogleに認識させる必要があります。

自サイトのコンテンツが他サイトに盗用された場合

自社サイトのコンテンツが他サイトに盗用されるリスクも想定しておきましょう。事前に自サイトのコンテンツが盗用されないようにコピペ対策用のプラグインをインストールすることをオススメします。

また、万が一コンテンツを盗用された場合には、そもそも著作権侵害ですので、掲載サイトに削除申請をするのが良いと思います。また、Googleの著作権侵害による削除申請フォームからコンテンツの削除申請が可能です。

重複コンテンツを意識したWebサイト運用を

重複コンテンツと見なされるリスクは、Webサイトを運用している以上は避けることができない重要な問題であることに変わりはありません。

しかし、Webサイトの設計段階で大幅にリスク軽減ができるものであると思っています。例えば、スマホ用に「/sp/」のディレクトリ構成にしないで、同じURLでレスポンシブにしてしまえば、このリスクはなくすことができます。

これからWebサイトを運用する人は本記事に書かれた内容をサイト設計である程度クリアできるように設計できれば、重複コンテンツのリスクを軽減できます。

また、すでにサイトを運営している人の場合には、これからサイトの状態をチェックされることを強くオススメします。