ウェブサイトのページコンテンツの類似性が高い理由と解決策

ウェブサイトのページコンテンツの類似性が高い理由と解決策

一般的に、ウェブサイト構築時に重複コンテンツを避けることは困難ですが、重複コンテンツは検索エンジンにおけるウェブサイトのパフォーマンスに大きな影響を与えます。本日は、重複コンテンツの原因と解決策についてご説明します。

重複コンテンツの主な理由

1. URL 標準化の問題。

URL 標準化の問題には、メインドメイン名の標準化とページ URL アドレスの標準化という 2 つの側面があります。メインドメイン名の標準化は標準化する必要があります。もう 1 つは、内部ページ URL の標準化です。通常、検索エンジンが Web サイトのコンテンツをより適切にクロールできるように、URL を擬似静的形式に処理します。ただし、一般的な Web サイトを擬似静的にした後も、元の動的 URL は引き続き存在し、アクセス可能であり、複数の URL が同じ URL にアクセスすることになります。

2. コンテンツの他のバージョン

多くのウェブサイトでは、通常版に加えて、印刷版や簡易版などの他の閲覧バージョンも提供していますが、検索エンジンによるこれらのページのクロールを禁止していないため、重複コンテンツページになります。

3. ウェブサイトの構造

多くのウェブサイトは、最初に設計するときに SEO 要素を考慮していません。その結果、さまざまなページ バージョンが作成されます。たとえば、製品は価格、コメント、時間などで並べ替えられます。このページ重複のこの現象は、一部の電子商取引ウェブサイトでは特に深刻です。

4. URL に文字が追加されても、ステータス コード 200 が返されます。

ウェブサイトのプログラミングと技術的な理由により、一部のウェブサイトでは、ユーザーが URL パラメータの後にランダムにいくつかの文字を追加することで正常にアクセスでき、ページは以前とまったく同じになります。

ページの重複バージョンがあるかどうかを確認する比較的簡単な方法があります。コンテンツから文をランダムに選択し、二重引用符で囲んで検索するだけです。結果から重複ページがいくつあるかがわかります。一般的に言えば、完全な生命を探すためにランダムに文章を選択する確率は比較的小さいからです。

重複コンテンツの危険性

多くの SEO 担当者は誤解しています。つまり、ウェブサイトに重複コンテンツがあると、検索エンジンからペナルティを受けると考えています。実際には、それほど深刻なことではありません。検索エンジンは、重複したすべてのページの中から最適なバージョンを選択してランキングに参加し、他の類似コンテンツは同時にランキングされません。

すると、疑問が生じます。まず、検索エンジンはどのページが最も本物であるか、またそれがウェブサイト管理者が推奨したいページと一致しているかどうかをどうやって判断するのでしょうか。検索エンジンが誤った判断をして、元のページをコピーされたコンテンツと見なし、コピーされたページを元のページと見なしたとしても、プロモーションの過程で元のバージョンを使用すると、あなたの作業は無駄になります。また、同じウェブサイトに複数のコンテンツのコピーが存在すると、ページの重みが分散されます。ページがウェブサイトに表示されるため、このページへのリンクがなければなりません。リンクが統一されていれば、すべての重みを集中させることができます。同時に、同じページが含まれると、検索エンジンスパイダーのクロールエネルギーもある程度占有され、実際にクロールする必要があるページが含まれる可能性が低くなります。

重複コンテンツを排除する方法

URL 正規化の問題を解決する最善の方法は、1 つのページに複数の異なるバージョンを持たず、1 つの URL のみを持ち、Web サイト上のすべてのリンクがこの URL を指すようにすることです。もちろん、元の程度やその他の理由により、1 つの URL に完全に統合できない場合もあります。その場合は、次の 3 つの方法を使用して重みを集中させることができます。

1. 301リダイレクト

301 はページの重みを転送できます。現在、主流の検索エンジンはすべて 301 リダイレクトをサポートしており、301 永続リダイレクトを通じて、コピーされたコンテンツを含むすべてのページを元のページにジャンプできます。

2. ロボットファイルは禁止されています

robots.txt ファイルでコピーされたコンテンツが検索エンジンによってクロールされるのを禁止することで、重複 URL の問題も効果的に解決できます。

3. 正規タグ

canonical タグは、2009 年に Google と Yahoo が共同でリリースした新しいタグです。Baidu も canonical タグのサポートを表明しており、このタグは重複 URL の問題を解決するためにも使用できます。

上記のタグを追加すると、どの URL が最も標準的でオリジナル バージョンであるかを検索エンジンに伝えることになります。他のコピーされたコンテンツはすべて、この固有の URL を指します。これは、301 ページの転送の重みに少し似ていますが、301 はページの直接ジャンプです。このタグを追加した後も、ページは元のアドレスに残ります。 a5の最初のリリース、

<<:  ウェブマスターは忘れられてはいませんが、進取的ではありません。

>>:  キーワードを最適に一致させる方法

推薦する

bluehost-14周年記念/仮想ホスティング40%オフ、月額2.65ドル、無料ドメイン名

bluehostさん、彼は何歳だと思いますか?今から午後 18:59 (北京時間午後 19:00) ...

ウェブサイトは安定的にホームページへのランキングを誘導する循環型エコシステムを構築します(パート3)

前回の記事「ウェブサイトに循環型エコシステムを構築し、ホームページへのランキングを安定的に誘導する(...

クラウドコンピューティングは企業のイノベーションの重要な原動力となっている

新たな情報技術革命により、従来のインターネットを覆す波が巻き起こっています。クラウド コンピューティ...

SEO サービスを選択する際に企業が避けるべき誤解

近年の電子商取引の台頭により、これまでは専門家だけが注目していた用語であるウェブサイト最適化、SEO...

産業インターネットの時代、華雲データは「クラウド」を活用して製造企業の変革とアップグレードを推進しています

[[264161]]江蘇省の「『インターネット+先進製造』による産業インターネットの発展の深化に関す...

関連リンクの比率とリンク幅についての簡単な説明

私は SEO の知識に関連する記事をたくさん読んできました。リンクの関連性が非常に重要だと言う人もい...

ノボシビルスク VPS: 無料 www、月額 9 元、トラフィック無制限

free-www を知らない人も多いかもしれません。ノボシビルスクのデータセンターにある VPS は...

15 分でハイブリッド クラウド プラットフォームを起動し、プライベート バトラーを無料で手に入れましょう。

バックグラウンドミュージック私は裕福な第二世代です退屈しのぎに会社を立ち上げました。私は今日入社した...

chicagovps-ssd vps シンプルレビュー

chicagovps は過去にデータ損失を経験しており、solusvm の脆弱性によりメンバーのデー...

プレーンテキストリンクに重みがないという主張はまったくのナンセンスである

SEO に触れたことのある人なら誰でも、外部リンクの形式は 1. アンカー テキスト形式、2. ハイ...

毎日平均5.9の共同購入サイトが閉鎖:バブルが崩壊し資本が閉鎖される

潮が引いて初めて、誰が裸で泳いでいるかが分かります。 2年間の試練と苦難を経て、国内の共同購入業界に...

Baidu の統計が SEO にどのように役立つか

百度統計は新年を迎えて第3版を更新した。 SEO の観点から見ると、第 3 版では第 2 版と比べて...

百度のオンライン外部リンク拒否ツールが私たちにもたらした影響と啓蒙

3月1日、Baiduは外部リンクを拒否するツールをリリースしました。青大根アルゴリズムに続いて、Ba...

百度アライアンスは昨年19億3000万元の収益を上げ、今年は40億元の収益を上げると予想されている。

新浪科技は5月24日午前、2013年百度連合サミットが本日雲南省シャングリラ市で開催されたと報じた。...

SEO 戦略のローカライズ: 5 つの重要な考慮事項

海外への市場拡大を進めていますが、最初のステップは何ですか?戦略間のつながり: SEO + PPC ...