ウェブサイトのページコンテンツの類似性が高い理由と解決策

ウェブサイトのページコンテンツの類似性が高い理由と解決策

一般的に、ウェブサイト構築時に重複コンテンツを避けることは困難ですが、重複コンテンツは検索エンジンにおけるウェブサイトのパフォーマンスに大きな影響を与えます。本日は、重複コンテンツの原因と解決策についてご説明します。

重複コンテンツの主な理由

1. URL 標準化の問題。

URL 標準化の問題には、メインドメイン名の標準化とページ URL アドレスの標準化という 2 つの側面があります。メインドメイン名の標準化は標準化する必要があります。もう 1 つは、内部ページ URL の標準化です。通常、検索エンジンが Web サイトのコンテンツをより適切にクロールできるように、URL を擬似静的形式に処理します。ただし、一般的な Web サイトを擬似静的にした後も、元の動的 URL は引き続き存在し、アクセス可能であり、複数の URL が同じ URL にアクセスすることになります。

2. コンテンツの他のバージョン

多くのウェブサイトでは、通常版に加えて、印刷版や簡易版などの他の閲覧バージョンも提供していますが、検索エンジンによるこれらのページのクロールを禁止していないため、重複コンテンツページになります。

3. ウェブサイトの構造

多くのウェブサイトは、最初に設計するときに SEO 要素を考慮していません。その結果、さまざまなページ バージョンが作成されます。たとえば、製品は価格、コメント、時間などで並べ替えられます。このページ重複のこの現象は、一部の電子商取引ウェブサイトでは特に深刻です。

4. URL に文字が追加されても、ステータス コード 200 が返されます。

ウェブサイトのプログラミングと技術的な理由により、一部のウェブサイトでは、ユーザーが URL パラメータの後にランダムにいくつかの文字を追加することで正常にアクセスでき、ページは以前とまったく同じになります。

ページの重複バージョンがあるかどうかを確認する比較的簡単な方法があります。コンテンツから文をランダムに選択し、二重引用符で囲んで検索するだけです。結果から重複ページがいくつあるかがわかります。一般的に言えば、完全な生命を探すためにランダムに文章を選択する確率は比較的小さいからです。

重複コンテンツの危険性

多くの SEO 担当者は誤解しています。つまり、ウェブサイトに重複コンテンツがあると、検索エンジンからペナルティを受けると考えています。実際には、それほど深刻なことではありません。検索エンジンは、重複したすべてのページの中から最適なバージョンを選択してランキングに参加し、他の類似コンテンツは同時にランキングされません。

すると、疑問が生じます。まず、検索エンジンはどのページが最も本物であるか、またそれがウェブサイト管理者が推奨したいページと一致しているかどうかをどうやって判断するのでしょうか。検索エンジンが誤った判断をして、元のページをコピーされたコンテンツと見なし、コピーされたページを元のページと見なしたとしても、プロモーションの過程で元のバージョンを使用すると、あなたの作業は無駄になります。また、同じウェブサイトに複数のコンテンツのコピーが存在すると、ページの重みが分散されます。ページがウェブサイトに表示されるため、このページへのリンクがなければなりません。リンクが統一されていれば、すべての重みを集中させることができます。同時に、同じページが含まれると、検索エンジンスパイダーのクロールエネルギーもある程度占有され、実際にクロールする必要があるページが含まれる可能性が低くなります。

重複コンテンツを排除する方法

URL 正規化の問題を解決する最善の方法は、1 つのページに複数の異なるバージョンを持たず、1 つの URL のみを持ち、Web サイト上のすべてのリンクがこの URL を指すようにすることです。もちろん、元の程度やその他の理由により、1 つの URL に完全に統合できない場合もあります。その場合は、次の 3 つの方法を使用して重みを集中させることができます。

1. 301リダイレクト

301 はページの重みを転送できます。現在、主流の検索エンジンはすべて 301 リダイレクトをサポートしており、301 永続リダイレクトを通じて、コピーされたコンテンツを含むすべてのページを元のページにジャンプできます。

2. ロボットファイルは禁止されています

robots.txt ファイルでコピーされたコンテンツが検索エンジンによってクロールされるのを禁止することで、重複 URL の問題も効果的に解決できます。

3. 正規タグ

canonical タグは、2009 年に Google と Yahoo が共同でリリースした新しいタグです。Baidu も canonical タグのサポートを表明しており、このタグは重複 URL の問題を解決するためにも使用できます。

上記のタグを追加すると、どの URL が最も標準的でオリジナル バージョンであるかを検索エンジンに伝えることになります。他のコピーされたコンテンツはすべて、この固有の URL を指します。これは、301 ページの転送の重みに少し似ていますが、301 はページの直接ジャンプです。このタグを追加した後も、ページは元のアドレスに残ります。 a5の最初のリリース、

<<:  ウェブマスターは忘れられてはいませんが、進取的ではありません。

>>:  キーワードを最適に一致させる方法

推薦する

イースター レイヤー: 年間 29.75 ドル、米国西海岸 AMD Ryzen VPS、2G メモリ/2 コア/50g NVMe/10T トラフィック/10Gbps 帯域幅/5 スナップショット

現在のイースター期間中、ドバイの VPS 販売業者である layer.ae は、米国西海岸のワシント...

ブランド マーケティング プロモーション: Durex のコンテンツ マーケティングの根底にあるロジック!

4月19日、DurexとHeyteaの国境を越えたマーケティング協力は失敗し、多くの否定的な評価を受...

通信事業者はクラウドコンピューティングをベースに5G事業の展開を深化

2018 年、世界のクラウド コンピューティング市場規模は 3,000 億米ドルを超え、中国のクラウ...

AWS が Amazon SageMaker の 9 つの新機能をリリース

12 月 9 日、Amazon Cloud Service (AWS) が開催する年次イベント AW...

不均一な業界パフォーマンスに合わせて最適化戦略を調整する方法

ウェブサイトの最適化は普遍的な技術でしょうか? ある程度の最適化作業経験を持つ人なら、それがすべての...

Linode-Germany Data Center KVM が利用可能になりました。ぜひお試しください。

HostUS の香港 VPS は最近、大量に購入されるなど、皆を夢中にさせています。今、とても人気が...

図 |分散システムをマスターする: プログラマーになるための道

[[384765]]プログラミングは芸術であり、その魅力は創造にあります。 65 兄さんは 2 年間...

フレンドリーリンクプラットフォームを使用して「壁を通り抜けて光を引き寄せる」ことでネットワークの静脈を改善します

大手ウェブマスターなら誰でも、新しいサイトでも古いサイトでも、友好的なリンクを交換する必要があること...

テンセントクラウドがチャレンジャーズクアドラントに選出され、2023年ガートナーコンテナ管理マジッククアドラントが発表

記者は10月17日、テンセントクラウドがガートナーが発表したばかりの2023年「コンテナ管理のマジッ...

Baiduの最新のデータアルゴリズムと考え方を共有する

みなさんこんにちは。朱衛坤が最新のデータ発見を皆さんにお伝えします。百度のクロール時間が更新されまし...

SmartHost: 専用サーバーが20%オフ、月額55ドルから、米国/英国を含む20のデータセンターから選択可能

1998 年に設立されたアメリカの老舗企業 Smarthost は、現在、3 つの独立したサーバーを...

ショッピングガイドコミュニティの開発は困難に直面しており、ユーザー蓄積システムを確立することは困難です。

わが国のショッピングガイドコミュニティは、わが国のインターネット企業の完全なオリジナル作品です。なぜ...

SNS運用におけるユーザー所有権の分析

みなさんこんにちは。今日はCool GrassrootsがSNSウェブサイトの運営におけるユーザー所...

6月の百度のアルゴリズム更新からわかるユーザーエクスペリエンスの重要性

百度が6月に新しいアルゴリズムを更新して以来、多数のコレクションサイト、一部のジャンクサイトグループ...