ウェブサイトのページコンテンツの類似性が高い理由と解決策

ウェブサイトのページコンテンツの類似性が高い理由と解決策

一般的に、ウェブサイト構築時に重複コンテンツを避けることは困難ですが、重複コンテンツは検索エンジンにおけるウェブサイトのパフォーマンスに大きな影響を与えます。本日は、重複コンテンツの原因と解決策についてご説明します。

重複コンテンツの主な理由

1. URL 標準化の問題。

URL 標準化の問題には、メインドメイン名の標準化とページ URL アドレスの標準化という 2 つの側面があります。メインドメイン名の標準化は標準化する必要があります。もう 1 つは、内部ページ URL の標準化です。通常、検索エンジンが Web サイトのコンテンツをより適切にクロールできるように、URL を擬似静的形式に処理します。ただし、一般的な Web サイトを擬似静的にした後も、元の動的 URL は引き続き存在し、アクセス可能であり、複数の URL が同じ URL にアクセスすることになります。

2. コンテンツの他のバージョン

多くのウェブサイトでは、通常版に加えて、印刷版や簡易版などの他の閲覧バージョンも提供していますが、検索エンジンによるこれらのページのクロールを禁止していないため、重複コンテンツページになります。

3. ウェブサイトの構造

多くのウェブサイトは、最初に設計するときに SEO 要素を考慮していません。その結果、さまざまなページ バージョンが作成されます。たとえば、製品は価格、コメント、時間などで並べ替えられます。このページ重複のこの現象は、一部の電子商取引ウェブサイトでは特に深刻です。

4. URL に文字が追加されても、ステータス コード 200 が返されます。

ウェブサイトのプログラミングと技術的な理由により、一部のウェブサイトでは、ユーザーが URL パラメータの後にランダムにいくつかの文字を追加することで正常にアクセスでき、ページは以前とまったく同じになります。

ページの重複バージョンがあるかどうかを確認する比較的簡単な方法があります。コンテンツから文をランダムに選択し、二重引用符で囲んで検索するだけです。結果から重複ページがいくつあるかがわかります。一般的に言えば、完全な生命を探すためにランダムに文章を選択する確率は比較的小さいからです。

重複コンテンツの危険性

多くの SEO 担当者は誤解しています。つまり、ウェブサイトに重複コンテンツがあると、検索エンジンからペナルティを受けると考えています。実際には、それほど深刻なことではありません。検索エンジンは、重複したすべてのページの中から最適なバージョンを選択してランキングに参加し、他の類似コンテンツは同時にランキングされません。

すると、疑問が生じます。まず、検索エンジンはどのページが最も本物であるか、またそれがウェブサイト管理者が推奨したいページと一致しているかどうかをどうやって判断するのでしょうか。検索エンジンが誤った判断をして、元のページをコピーされたコンテンツと見なし、コピーされたページを元のページと見なしたとしても、プロモーションの過程で元のバージョンを使用すると、あなたの作業は無駄になります。また、同じウェブサイトに複数のコンテンツのコピーが存在すると、ページの重みが分散されます。ページがウェブサイトに表示されるため、このページへのリンクがなければなりません。リンクが統一されていれば、すべての重みを集中させることができます。同時に、同じページが含まれると、検索エンジンスパイダーのクロールエネルギーもある程度占有され、実際にクロールする必要があるページが含まれる可能性が低くなります。

重複コンテンツを排除する方法

URL 正規化の問題を解決する最善の方法は、1 つのページに複数の異なるバージョンを持たず、1 つの URL のみを持ち、Web サイト上のすべてのリンクがこの URL を指すようにすることです。もちろん、元の程度やその他の理由により、1 つの URL に完全に統合できない場合もあります。その場合は、次の 3 つの方法を使用して重みを集中させることができます。

1. 301リダイレクト

301 はページの重みを転送できます。現在、主流の検索エンジンはすべて 301 リダイレクトをサポートしており、301 永続リダイレクトを通じて、コピーされたコンテンツを含むすべてのページを元のページにジャンプできます。

2. ロボットファイルは禁止されています

robots.txt ファイルでコピーされたコンテンツが検索エンジンによってクロールされるのを禁止することで、重複 URL の問題も効果的に解決できます。

3. 正規タグ

canonical タグは、2009 年に Google と Yahoo が共同でリリースした新しいタグです。Baidu も canonical タグのサポートを表明しており、このタグは重複 URL の問題を解決するためにも使用できます。

上記のタグを追加すると、どの URL が最も標準的でオリジナル バージョンであるかを検索エンジンに伝えることになります。他のコピーされたコンテンツはすべて、この固有の URL を指します。これは、301 ページの転送の重みに少し似ていますが、301 はページの直接ジャンプです。このタグを追加した後も、ページは元のアドレスに残ります。 a5の最初のリリース、

<<:  ウェブマスターは忘れられてはいませんが、進取的ではありません。

>>:  キーワードを最適に一致させる方法

推薦する

Webmaster Network レポート: OpenSSL の重大な脆弱性の詳細な説明: 史上最悪のブラウザ IE6 が消滅

1. OpenSSL の重大な脆弱性の詳細な説明: 誰が影響を受けるのか? どのように解決するのか?...

オンライン収入プロジェクト:財源宝とは一体何なのか?これはお金を生み出すことができますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています財源宝はW...

#ニュース# digitalocean: 高まる需要に応えるため、新しい「サンフランシスコ 3」を追加

DigitalOceanは世界8カ国または都市に自社データセンターを運営し、あらゆる人々のために何百...

EKS セキュリティ チェックリスト: 安全なクラスターのための 10 のベスト プラクティス

Kubernetes クラスターを保護し、アプリケーションのセキュリティを強化するための 10 の ...

永久に無料のオープンソースモールシステムはありますか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますまず、「相...

デジタルオーシャンはどうですか? [年] Digitaloceanのインドデータセンターの簡単なレビュー

デジタルオーシャンはどうですか?デジタルオーシャンインドはどうですか?現在の国内のインターネットアク...

メタバース開発研究レポート

メタバースはソーシャルゲームの考え方に基づいていますが、ゲームの属性や特徴から切り離され、文化、人種...

ウェブサイト最適化担当者は、最適化タスクを実行する際にどのような基準に従う必要がありますか?

SEO を必要とする企業や事業所がますます増えているため、現在の SEO 業界は混乱状態にあります。...

hiformance: ブラックフライデーのプレセール、ハイエンドKVM仮想VPS、Windows、Alipay付き

Hiformance のブラックフライデーのプレセールでは、高構成の KVM 仮想 VPS を提供し...

進化: Web プロキシ サーバーから分散プッシュ サーバーへの Tengine

テンエンジンプロキシ サーバーとして、Tengine はグループ内で幅広いアプリケーションを備えてい...

虚偽広告は、オンラインセレブの製品ルーチンやオンラインマーケティングでよくある問題です。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますネット有名...

近年のウェブサイトランキングの急上昇の重要な理由

みなさんこんにちは。ハルビンバーチャルリアリティウェブサイトデザインです。最近、いくつかのサイトのラ...

AWS + Dahua Technology:海外ビジネス経験におけるイノベーション?バーストポイントが必要です!

「企業は急速な発展の過程で、徐々に洗練された管理を強化し、効率を高め、コストを削減すると同時に、顧客...

百度、360の訴訟に反応「中国のインターネット業界全体のイメージに恥をかかせる」

A5ウェブマスターネットワークは11月27日、百度が本日、奇虎が百度に対して提起した不正競争訴訟の裁...