ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

オンラインの世界は非常に広大で、新しいコンテンツが常に生成されています。 Google 自身のリソースには限りがあります。ほぼ無限の Web コンテンツがある場合、Googlebot はそのうちの一定の割合しか見つけてクロールできません。そうすると、すでにクロールしたコンテンツのうち、その一部しかインデックス化できなくなります。 URL は、Web サイトと検索エンジン クローラーの間の橋渡しのような役割を果たします。Web サイトのコンテンツをクロールするには、クローラーがこれらの橋渡しを見つけて通過できる必要があります (つまり、URL を見つけてクロールする必要があります)。 URL が複雑または長い場合、クローラーは URL を何度もたどる必要があり、時間がかかります。URL が簡潔で、独自のコンテンツに直接リンクしている場合、クローラーは空のページをクロールしたり、異なる URL に誘導されて同じ重複コンテンツをクロールしたりするのではなく、コンテンツの学習に集中できます。

上のスライドでは、避けるべき反例をいくつか見ることができます。これらは、ハッキングされた URL やエンコード、URL パスの一部として偽装された冗長なパラメータ、無限のクロール スペースなど、実際の URL の例です (ただし、プライバシー上の理由から名前は変更されています)。また、この URL の迷路を整理し、クローラーがコンテンツをより速く、より適切に見つけられるようにするためのいくつかの提案も見つかります。主な提案には、URL からユーザー関連のパラメータを削除することが含まれます。セッション ID や並べ替えパラメータなど、ページのコンテンツに影響を与えない URL 内のパラメータは、URL から削除され、Cookie によって記録されます。この情報を Cookie に保存し、「クリーンな」 URL に 301 リダイレクトすることで、元のコンテンツを維持し、同じコンテンツを指す URL の数を減らすことができます。

無限の空間をコントロールします。あなたのサイトには、過去と未来の日付へのリンクが無数にあるカレンダーがありますか (各リンクは一意です)?ページの数がそれほど多くない場合でも、パラメータ &page=3563 を追加した後も、Web アドレスは 200 コードを返しますか?この場合、サイトにはいわゆる「無限のスペース」が存在し、クローラーとサイトの両方の帯域幅が無駄になります。 「無限の空間」を制御するためのヒントをいくつか紹介します。 Google クローラーが処理できないページをクロールしないようにします。 robots.txt ファイルを使用すると、ログイン ページ、お問い合わせフォーム、ショッピング カート、およびクローラーが処理できないその他のページをブロックできます。 (クローラーはケチで恥ずかしがり屋として知られているため、通常は自分で「商品をカートに追加」したり「お問い合わせ」したりすることはありません)。こうすることで、クローラーが処理できる範囲でサイトのコンテンツをクロールする時間を長くすることができます。

一人一票。 URL、コンテンツの一部。理想的な世界では、URL とコンテンツは 1 対 1 で対応します。つまり、各 URL は固有のコンテンツに対応し、各コンテンツには固有の URL を通じてのみアクセスできます。この理想的な状況に近づくほど、Web サイトのクロールとインデックス作成が容易になります。コンテンツ管理システムまたは現在のサイト設定によりこれが難しい場合は、rel=canonical 要素を使用して、特定のコンテンツを参照するために使用する URL を設定することができます。

元のタイトル: ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由の簡単な分析

キーワード: 検索エンジン

<<:  1 か月で毎日の IP を 1,000 から 20,000 に増やす方法

>>:  スパムの9つの種類を解明

推薦する

「藁舟から矢を借りる」の物語から SEO 啓蒙について簡単に説明します

三国時代、英雄曹操は80万人の兵士を率いて東呉を征服しました。孫権と劉備は力を合わせて勢力均衡を図る...

Wuyun は鉄道省の 12306 ウェブサイトで SQL インジェクションなどの複数の脆弱性を暴露しました

admin5.comが9月28日に報じたところによると、国内の有名な脆弱性報告プラットフォームは9月...

クラウドエッジコラボレーションアーキテクチャ:深く統合されたクロスレベルサービスの実現

情報技術の急速な発展に伴い、クラウドコンピューティングとエッジコンピューティングは徐々に現代社会の主...

ウェブサイトのキーワードランキングでは制御できない要素を数える

ウェブサイトのランキングの変化は、SEO を行う人が最も懸念していることです。SEO 作業を行うと、...

動画サイトには10​​万人以上のキャスターがおり、一部のサイトは「オンラインナイトクラブ」と呼ばれている。

インターネット接続可能なパソコン、ウェブカメラ、セミプロ仕様のマイクが、シャオウェンさんの「仕事」に...

imidc: 「双方向」南アフリカ cn2 vps の簡単なレビュー。十分ではないと思われる場合は、専用サーバーを使用することもできます。

現在、欧米のCN2ネットワークは圧迫されており、帯域幅のコストも急騰しています。アジアのCN2の価格...

Baidu Spiderのオリジナルコンテンツ取得方法の再理解

Baidu の当初の火星計画は、かつて多くのウェブマスターを落胆させました。どうして彼らは、ウェブサ...

エッジの台頭 - いつでもどこでも分析とコンピューティング

[[435346]]データの重要性の高まりは、おそらくインターネット革命の最も重要な副作用の 1 つ...

地域社会をより大きく、より強くする方法:天谷の成功要因についての簡単な議論

地域コミュニティをより大きく、より強くする方法 - 天耶の成功要因についての簡単な説明 天耶コミュニ...

SEO はインターネット マーケティング手法の 1 つにすぎません。あまり偏りすぎないようにしてください。

ウェブマスターとして、私たちは SEOER が毎日行うべきことを行っています。つまり、毎日外部リンク...

ウェブサイトの外部リンクを制御する方法についての簡単な説明

SEO 業界に不慣れなウェブマスターは、ウェブサイトを素早く最適化してすぐにランキングを獲得し、SE...

実例から考えるインターネットマーケティング

最近、私たちの住んでいるところからそう遠くないところに、「スネークハウス」というレストランがあります...

ユーザーの告白: FriendNet が歴史の舞台から去る時が来た

長い間Renrenを利用していませんでしたか?友達ネットワークがあることをほとんど忘れていましたか?...

モノのインターネット (IoT) 向けトップ 11 クラウド プラットフォーム

ここでは、モノのインターネット (IoT) 開発に最も人気があり推奨されるプラットフォームを紹介しま...

張有為のインターネットマーケティングに関する見解:正しいと思うことは間違っている

現在、多くの企業がオンラインマーケティングを行っていますが、オンラインマーケティングとは何かを明確に...