ウェブサイト上の重複コンテンツは有害であり、ウェブマスターはそれに備える必要がある

インターネットの不安定な発展により、ネットユーザーはより多くのオリジナルコンテンツを持つことができず、その結果、ウェブサイト上のほとんどのコンテンツが収集され、インターネットスパムが大量に拡散するようになりました。ウェブマスターは皆、このような重複コンテンツには何のメリットもないことを知っています。たとえウェブサイトがそのようなコンテンツから一定期間利益を得ていたとしても、ウェブマスターは事前に計画を立て、ウェブサイト上の重複コンテンツを減らし、ウェブサイト全体の品質を向上させる必要があります。

重複コンテンツはなぜ発生するのでしょうか?

重複コンテンツとは、異なる URL リンクのコンテンツが同じであることを意味します。重複コンテンツの原因としては、コンテンツコレクションが考えられます。コンテンツコレクションでは、他のサイトのコンテンツがコレクションツールを使用して直接収集されます。Web サイトには非標準の URL のためアクセスできる URL アドレスが複数あり、スパイダーも同時に複数の重複ページを収集します。Web サイトには 404 エラーページがなく、すべてのエラーリンクはデフォルトでホームページにジャンプします。このエラーリンクの処理方法も、Web サイトに大量の重複ページが存在することにつながります。または、ショッピングモールのような Web サイトでは、製品のサイズが異なるため、紹介ページが複数設定されていますが、Web ページの大まかなコンテンツは同じであるため、このような状況もスパイダーによって重複コンテンツと見なされます。

重複コンテンツを検出する方法

自分のサイト内に重複コンテンツがある場合、それを検出するのは比較的簡単です。site: ドメイン名を使用して、検索エンジンが重複コンテンツをインデックスしているかどうかを確認できます。ただし、外部のページに繰り返しがあるかどうかを確認したい場合は、そのページから文章を抜き出し、二重引用符を付けて検索エンジンで検索することができます。インターネット上に同一の文章が多数ある場合は、クリックして表示すると、Web ページ全体が繰り返しになっているかどうかがわかります。このような検出方法は難しい場合が多く、別の記事に出てくる文が見つかる確率は低くなります。記事が盗作であるかどうかを検出するには、「title: + 記事タイトル」で同じ記事を見つけることができます。、

重複コンテンツは有害ですか?

ウェブサイトに大量の重複コンテンツが収集されている場合、検索エンジンはそのようなサイトをスパムサイトと見なし、すぐに検索エンジンによって降格されます。検索エンジンは、重複コンテンツが多いサイトを降格することがよくありますが、スパイダーはコピーされたコンテンツが少ないサイトを降格しません。スパイダーは、重複ページのうちどのページがオリジナルであるかを判断し、そのような重複ページをランク付けします。検索エンジンは時々誤った判断を下し、ウェブマスターがよく目にする現象につながります。つまり、自分のオリジナルコンテンツが他のサイトに転載され、他のサイトのランキングは良いのに自分のサイトが含まれないということです。自分のウェブサイトに重複ページがあり、スパイダーが収集したページリンクがプロモーションリンクと一致していないため、ウェブサイトの軽量化につながります。特にウェブサイトの一部の重要なページでは、URLリンクが複数あると、ユーザーが覚えにくく、スパイダーにとっても不正な最適化方法です。重複コンテンツが多いサイトの場合、検索エンジンは不正な最適化を疑い、ダウングレードします。

重複コンテンツを排除する方法

ウェブサイト内の重複コンテンツは、多くの場合、非標準の URL から発生します。非標準の URL の問題に対する最善の解決策は、ウェブサイトのすべての内部リンクを統一された URL リンクにリダイレクトして、ウェブサイトの重量損失を減らすことです。異なるバージョンによって発生した重複コンテンツについては、ロボットファイルを使用してブロックしたり、スパイダーが不要なページをクロールするのを禁止したり、含めたくないリンクに nofollow タグを使用したりすることができます。上記のショッピングモールのウェブサイトでは、商品のサイズが異なるため、重複したページが含まれています。canonical タグを使用できます。Baidu が Canonical タグをサポートした後、ウェブマスターはページの非標準バージョンに要素と rel="canonical" 属性を追加することで、検索エンジンの標準ページを指定できます。外部サイトに表示される重複コンテンツについては、ウェブマスターとコミュニケーションを取り、記事コンテンツの元のソースを追加することで、元のコンテンツの収集によって生じる損害を軽減できます。

ウェブサイト上の重複コンテンツが必ずしもウェブサイトに影響を及ぼすわけではありませんが、大量のコンテンツが収集されたサイトは検索エンジン上で長く機能しません。パートタイムジョブ (http://www.jianzhi8.com) は、ウェブマスターが重複コンテンツの問題を本当に解決したいのであれば、重複コンテンツの可能性を減らすために、ウェブサイトにオリジナルのコンテンツを提供する必要があると考えています。あなたのサイトをユニークなものにするよう努めてください。

元のタイトル: ウェブサイト上の重複コンテンツは有害であり、ウェブマスターは雨の日のために備える必要がある

キーワード: ウェブサイトの繰り返し、重複コンテンツ、危険なコンテンツ、重大な危害、ウェブマスター、将来に備える必要性、インターネット、不安定、固定投稿、ウェブサイトの宣伝、収益化

<<: 再び判明した：百度はPPS買収の意向に署名し、近日中にデューデリジェンスを実施する予定

>>: 外部リンク構築段階：初期段階ではホームページにリンクし、後期段階では内部ページにリンクする