ウェブサイトのページコンテンツの類似性が高い理由と解決策

ウェブサイトのページコンテンツの類似性が高い理由と解決策

一般的に、ウェブサイト構築時に重複コンテンツを避けることは困難ですが、重複コンテンツは検索エンジンにおけるウェブサイトのパフォーマンスに大きな影響を与えます。本日は、重複コンテンツの原因と解決策についてご説明します。

重複コンテンツの主な理由

1. URL 標準化の問題。

URL 標準化の問題には、メインドメイン名の標準化とページ URL アドレスの標準化という 2 つの側面があります。メインドメイン名の標準化は標準化する必要があります。もう 1 つは、内部ページ URL の標準化です。通常、検索エンジンが Web サイトのコンテンツをより適切にクロールできるように、URL を擬似静的形式に処理します。ただし、一般的な Web サイトを擬似静的にした後も、元の動的 URL は引き続き存在し、アクセス可能であり、複数の URL が同じ URL にアクセスすることになります。

2. コンテンツの他のバージョン

多くのウェブサイトでは、通常版に加えて、印刷版や簡易版などの他の閲覧バージョンも提供していますが、検索エンジンによるこれらのページのクロールを禁止していないため、重複コンテンツページになります。

3. ウェブサイトの構造

多くのウェブサイトは、最初に設計するときに SEO 要素を考慮していません。その結果、さまざまなページ バージョンが作成されます。たとえば、製品は価格、コメント、時間などで並べ替えられます。このページ重複のこの現象は、一部の電子商取引ウェブサイトでは特に深刻です。

4. URL に文字が追加されても、ステータス コード 200 が返されます。

ウェブサイトのプログラミングと技術的な理由により、一部のウェブサイトでは、ユーザーが URL パラメータの後にランダムにいくつかの文字を追加することで正常にアクセスでき、ページは以前とまったく同じになります。

ページの重複バージョンがあるかどうかを確認する比較的簡単な方法があります。コンテンツから文をランダムに選択し、二重引用符で囲んで検索するだけです。結果から重複ページがいくつあるかがわかります。一般的に言えば、完全な生命を探すためにランダムに文章を選択する確率は比較的小さいからです。

重複コンテンツの危険性

多くの SEO 担当者は誤解しています。つまり、ウェブサイトに重複コンテンツがあると、検索エンジンからペナルティを受けると考えています。実際には、それほど深刻なことではありません。検索エンジンは、重複したすべてのページの中から最適なバージョンを選択してランキングに参加し、他の類似コンテンツは同時にランキングされません。

すると、疑問が生じます。まず、検索エンジンはどのページが最も本物であるか、またそれがウェブサイト管理者が推奨したいページと一致しているかどうかをどうやって判断するのでしょうか。検索エンジンが誤った判断をして、元のページをコピーされたコンテンツと見なし、コピーされたページを元のページと見なしたとしても、プロモーションの過程で元のバージョンを使用すると、あなたの作業は無駄になります。また、同じウェブサイトに複数のコンテンツのコピーが存在すると、ページの重みが分散されます。ページがウェブサイトに表示されるため、このページへのリンクがなければなりません。リンクが統一されていれば、すべての重みを集中させることができます。同時に、同じページが含まれると、検索エンジンスパイダーのクロールエネルギーもある程度占有され、実際にクロールする必要があるページが含まれる可能性が低くなります。

重複コンテンツを排除する方法

URL 正規化の問題を解決する最善の方法は、1 つのページに複数の異なるバージョンを持たず、1 つの URL のみを持ち、Web サイト上のすべてのリンクがこの URL を指すようにすることです。もちろん、元の程度やその他の理由により、1 つの URL に完全に統合できない場合もあります。その場合は、次の 3 つの方法を使用して重みを集中させることができます。

1. 301リダイレクト

301 はページの重みを転送できます。現在、主流の検索エンジンはすべて 301 リダイレクトをサポートしており、301 永続リダイレクトを通じて、コピーされたコンテンツを含むすべてのページを元のページにジャンプできます。

2. ロボットファイルは禁止されています

robots.txt ファイルでコピーされたコンテンツが検索エンジンによってクロールされるのを禁止することで、重複 URL の問題も効果的に解決できます。

3. 正規タグ

canonical タグは、2009 年に Google と Yahoo が共同でリリースした新しいタグです。Baidu も canonical タグのサポートを表明しており、このタグは重複 URL の問題を解決するためにも使用できます。

上記のタグを追加すると、どの URL が最も標準的でオリジナル バージョンであるかを検索エンジンに伝えることになります。他のコピーされたコンテンツはすべて、この固有の URL を指します。これは、301 ページの転送の重みに少し似ていますが、301 はページの直接ジャンプです。このタグを追加した後も、ページは元のアドレスに残ります。 a5の最初のリリース、

<<:  ウェブマスターは忘れられてはいませんが、進取的ではありません。

>>:  キーワードを最適に一致させる方法

推薦する

シャオ・ナンがSEOについて語る - SEOの経験と実践

私はいつも、ウェブサイトとその訪問者の関係は 1-1=0 ではなく、1-1=2 であると考えています...

中国におけるウェブサイト構築の発展にはどの程度の勢いがあるのでしょうか?

近年、経済の継続的な発展に伴い、中国のネットワーク構築市場は急速に発展し、成長してきました。データ分...

「クラウドコンピューティング開発白書(2020年)」、6つの主要なトレンドは、クラウドコンピューティングが包括的な開発の時代に入ることを示しています

7月29日、中国情報通信研究院、中国通信標準化協会が主催し、クラウドコンピューティングオープンソース...

もう一つのテイクアウト注文プラットフォーム「フェイファン」は、商店に最高のサービスを提供することで「カーブで追い越す」ことを試みている。

「飛帆」は、キャンパスを中心としたフードデリバリー取引プラットフォームを主に運営する西安の新興企業で...

最大vps-128MメモリKVM年間支払額12米ドル/ロサンゼルス/nlayer

MaximumVPS では、Duel L5420、16GB RAM、4 台の 1TB WD RE ド...

ERPが危機に瀕している理由

[[211676]] ERP の概念、事例、ソリューションが普及しているこの時代においても、ほとんど...

2022 年に IT 業界、労働力、ビジネス モデルに影響を与える可能性のあるトップ 10 のトレンド

調査機関CompTIAが最近発表した調査報告書によると、IT業界と従業員は、新型コロナウイルスの流行...

なぜ私たちはSina Weiboマーケティングは長いプロセスだとよく言われるのでしょうか

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス鄧超は「走れ!男」の演技...

アリ、人口ボーナスを十分に享受することはできませんよ!

創立20周年を迎えたアリババ(NYSE: BABA)の財務報告は、同社の強さと獰猛さを改めて示した。...

コンバージョン率を向上させるための Baidu 入札の方法

百度入札は、大多数の中小企業経営者にとってマーケティングの戦場です。百度がボスであり、検索市場の80...

淘宝特別価格版がWeChatミニプログラムで利用可能になりました。希望はありますか?

最近、アリババがテンセントWeChat上でタオバオ特別版ミニプログラムを立ち上げ、特定のシナリオでタ...

ramnode-35% オフ/すべての VPS/長期割引コード

ramnode に関して、ここで少し説明します。シアトル データ センターは DDoS 保護をサポー...

コミュニケーションツール「Line」の評価額100億ドルは妥当か?

日本のインスタントメッセージング企業LINEの親会社ネイバーは水曜日、LINEが東京で新規株式公開(...

副業でお金を稼ぎますか?副収入を得るのに役立つ起業家向けウェブサイト 5 選

私はいつも自分自身にこの質問をしてきました。誰かが広告を出しているのを見るといつも、私は尋ねたくなり...

国家インターネット情報局が複数の恐喝ウェブサイトを調査し処罰

新華網、北京、9月13日(新華社)―中国サイバースペース管理局から記者が得た情報によると、最近、多数...