ウェブサイト上の重複コンテンツに対する Google の 10 のヒント

ウェブサイト上の重複コンテンツに対する Google の 10 のヒント

検索エンジン戦略会議が最近、寒いシカゴで開催されました。 Google の参加者の多くは、重複コンテンツに関する質問を常に受け​​ます。このテーマに関しては、断片的で混乱した理解が数多くあることがわかりました。ここでこれを明確にしたいと思います。

検索エンジン戦略会議が最近、寒いシカゴで開催されました。 Google の参加者の多くは、重複コンテンツに関する質問を常に受け​​ます。このテーマに関しては、断片的で混乱した理解が数多くあることがわかりました。ここでこれを明確にしたいと思います。

重複コンテンツとは何ですか?

重複コンテンツとは、一般的に、異なるドメイン名間に同一または類似のコンテンツが大量に存在することを指します。多くの場合、それは意図的ではないか、少なくとも悪意のあるものではありません。たとえば、一部のフォーラムではモバイル画面専用のページが生成され、ストアのアイテムは複数の異なる URL で表示され (場合によってはリンクも張られる) ます。しかし、場合によっては、検索エンジンのランキングを操作し、人気のあるクエリやロングテールクエリのトラフィックを増やすために、他のウェブサイトから大量のコンテンツをコピーするウェブサイトもあります。

重複コンテンツではないものは何ですか?

Google には当サイト向けの使いやすい翻訳機能がありますが、当社のアルゴリズムでは、同じコンテンツの英語版とスペイン語版を重複コンテンツとは見なしません。同様に、あなたの記事内の他の記事からの短い引用が重複コンテンツとして識別されることを心配する必要はありません。

Google が重複コンテンツを気にするのはなぜですか?

Google ユーザーは一般的に、Google を使用する際に多様で独創的なコンテンツを見たいと考えています。まったく同じ検索結果が大量に見つかったら、どれほど迷惑なことか想像がつきます。さらに、ウェブマスターは、example.com/contentredir?value=shorty-george〈=en のような複雑な URL を Google が配布することを望んでいません。彼らは、example.com/en/shorty-george.htm のような URL を好む傾向があります。

Googleは何をしたのでしょうか?

Google はウェブをクロールして検索結果を取得する際、常に異なるコンテンツのページをインデックスして表示しようとします。このフィルタリングにより、たとえば、サイトに記事の通常バージョンと印刷バージョンがあり、robots.txt に noindex タグが設定されていない場合、Google は Google ユーザーに表示するバージョンを 1 つだけ選択します。まれに、コピーされたコンテンツを使用してランキングを操作し、Google ユーザーを欺こうとする試みがあった場合、Google は関連ページのインデックス作成とランキングを適切に調整します。もちろん、私たちはランキング調整よりもフィルタリングに重点を置くことを好みます...そのため、ほとんどの場合、最悪のシナリオは、元の作成者が望まないバージョンがインデックスに表示されるのを目にすることです。

ウェブマスターはどのようにしてコンテンツの重複問題に積極的に対処できるでしょうか?

検索エンジンのアクセスを適切にブロックする: アルゴリズムにファイルの「最適な」バージョンを決定させるのではなく、Google に優先バージョンを選択するように指示することもできます。たとえば、サイトの記事の印刷版をインデックスに登録したくない場合は、robots.txt ファイルにディレクトリ名または正規表現を記述して、Google がそれらの印刷版をクロールしないようにすることができます。

301 リダイレクトを使用する: ウェブサイトを再構築した場合は、元のウェブサイトの .htaccess で 301 リダイレクト (永続的なリダイレクト) を使用して、ユーザー、Google クローラー、その他の検索エンジン スパイダーをリダイレクトしてください。

リンクの一貫性を保つ: 内部リンクの一貫性を保つようにしてください。/page/、/page、/page/index.htm は使用しないでください。

トップレベル ドメインを使用する: 常に最も適切なバージョンのドキュメントを使用できるようにするには、可能な限り国固有のトップレベル ドメインを使用してください。 example.de は、example.com/de や de.example.com のような URL よりも、ドイツ語中心のコンテンツであることが Google にとって明らかに明確になります。

シンジケーションに注意してください: 他のサイトにコンテンツを提供する場合は、他のサイトの各記事に元の記事へのリンクを含めてください。注: ただし、クエリに対して Google は常に最も適切と思われるバージョン (サイトで禁止されていないバージョン) を表示しますが、それがユーザーの希望するバージョンであるとは限りません。

Google ウェブマスター ツールの優先ドメイン機能を使用する: 他のサイトが www 付きバージョンと www なしバージョンの両方を使用して URL にリンクしている場合は、Google ウェブマスター ツールを使用して、インデックスの作成方法をお知らせいただけます。

テンプレート ページの重複コンテンツを減らす: たとえば、著作権表示を例に挙げてみましょう。2 つのオプションがあります。1 つは、各ページの下部に長い著作権表示を配置することです。もう 1 つの方法は、専用の著作権に関する声明ページを設定し、各ページの下部に非常に短い要約を記述して、著作権に関する声明ページにリンクすることです。

元のタイトル: ウェブサイト上の重複コンテンツに対する Google の 10 の提案

キーワード: Google

<<:  SEO: リンク ベイトを作成する 10 の方法

>>:  検索エンジンマーケティング (SEM) の 10 大原則

推薦する

digitalocean - 4月にもう1つの10ドル割引コード

4月に、digitaloceanは10ドルの割引コードを次々とリリースしました。もちろん、それらはす...

新人SEO担当者がサナギから蝶になるまでの心理的旅

今日は私が SEO 担当者になってから 1 か月目の記念日です。 1か月で、私は無知な新人、混乱した...

SEO診断:医療ウェブサイトの総合分析K

みなさんこんにちは。私は徐子宇です。先ほど収集した SEO 診断事例に続いて、非常に興味深いことが分...

アリペイはビットコイン取引を停止し、タオバオストアを禁止すると発表した。

アリペイはビットコイン取引を停止し、タオバオストアを禁止すると発表した。 【TechWeb Repo...

ramhost Atlanta KVM が SSD キャッシュを追加

Ramhost は設立されてから 4 年になります。本日、同社がペースを速め、キャッシュに SSD ...

macloud: ロシアのクラウドサーバー、日払い、最低1元/日、AMD EPYC/Intel Gold +NVMe+64Tトラフィック/月、カスタムアップロードISO

ロシアのサーバー業者であるMacloudは、ロシアのモスクワにあるDataproデータセンターで主に...

AWS クラウドへの移行: 考慮すべき事項

ある日、AWS/GCP/Azure/その他のクラウドプロバイダーに移行するように言われたらどうします...

リーダーシップの大幅刷新後、Google Cloud の断片化と成長の鈍化の責任は誰にあるのでしょうか?

[[250357]]フェイフェイ・リー氏は去り、グーグルAI中国センターのリー・ジア所長も去った。今...

SEO診断事例: Webページの信号対雑音比とURLレイアウト

みなさんこんにちは。私はMuzi Chengzhouです。私のことをよく知っている友人は、私のブログ...

bgpto: シンガポール cn2 gia 専用サーバー、100Mbps cn2 gia 帯域幅、25% 割引、デュアル e5、112.5 ドルから

bgpto も古いブランドで、シンガポールサーバー、日本サーバー(東京、大阪)、香港サーバー、米国サ...

meanservers-15USD/年/KVM/128MB RAM/ロサンゼルス/デンバー

meanservers.com は 2009 年に設立されました。市場を拡大するために、一時期は低価...

小紅書は密かに海外へ出向く

毎日2時間以上「小紅書」(「小紅書」ユーザーの別名)を利用するヘビーユーザーとして、ここ数ヶ月、香港...

「MQ シリーズをマスターする」 - カフカの謎を解き明かす

[[390063]]みなさんこんにちは。私はウー兄弟です。これは「MQ マスタリー シリーズ」の第 ...

分散ロックに関する10,000語の記事

[[419431]] 「分散ロック」の問題はこれまで多くの議論がなされてきましたが、著者は満足のいく...