ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由を簡単に分析します。

オンラインの世界は非常に広大で、新しいコンテンツが常に生成されています。 Google 自身のリソースには限りがあります。ほぼ無限の Web コンテンツがある場合、Googlebot はそのうちの一定の割合しか見つけてクロールできません。そうすると、すでにクロールしたコンテンツのうち、その一部しかインデックス化できなくなります。 URL は、Web サイトと検索エンジン クローラーの間の橋渡しのような役割を果たします。Web サイトのコンテンツをクロールするには、クローラーがこれらの橋渡しを見つけて通過できる必要があります (つまり、URL を見つけてクロールする必要があります)。 URL が複雑または長い場合、クローラーは URL を何度もたどる必要があり、時間がかかります。URL が簡潔で、独自のコンテンツに直接リンクしている場合、クローラーは空のページをクロールしたり、異なる URL に誘導されて同じ重複コンテンツをクロールしたりするのではなく、コンテンツの学習に集中できます。

上のスライドでは、避けるべき反例をいくつか見ることができます。これらは、ハッキングされた URL やエンコード、URL パスの一部として偽装された冗長なパラメータ、無限のクロール スペースなど、実際の URL の例です (ただし、プライバシー上の理由から名前は変更されています)。また、この URL の迷路を整理し、クローラーがコンテンツをより速く、より適切に見つけられるようにするためのいくつかの提案も見つかります。主な提案には、URL からユーザー関連のパラメータを削除することが含まれます。セッション ID や並べ替えパラメータなど、ページのコンテンツに影響を与えない URL 内のパラメータは、URL から削除され、Cookie によって記録されます。この情報を Cookie に保存し、「クリーンな」 URL に 301 リダイレクトすることで、元のコンテンツを維持し、同じコンテンツを指す URL の数を減らすことができます。

無限の空間をコントロールします。あなたのサイトには、過去と未来の日付へのリンクが無数にあるカレンダーがありますか (各リンクは一意です)?ページの数がそれほど多くない場合でも、パラメータ &page=3563 を追加した後も、Web アドレスは 200 コードを返しますか?この場合、サイトにはいわゆる「無限のスペース」が存在し、クローラーとサイトの両方の帯域幅が無駄になります。 「無限の空間」を制御するためのヒントをいくつか紹介します。 Google クローラーが処理できないページをクロールしないようにします。 robots.txt ファイルを使用すると、ログイン ページ、お問い合わせフォーム、ショッピング カート、およびクローラーが処理できないその他のページをブロックできます。 (クローラーはケチで恥ずかしがり屋として知られているため、通常は自分で「商品をカートに追加」したり「お問い合わせ」したりすることはありません)。こうすることで、クローラーが処理できる範囲でサイトのコンテンツをクロールする時間を長くすることができます。

一人一票。 URL、コンテンツの一部。理想的な世界では、URL とコンテンツは 1 対 1 で対応します。つまり、各 URL は固有のコンテンツに対応し、各コンテンツには固有の URL を通じてのみアクセスできます。この理想的な状況に近づくほど、Web サイトのクロールとインデックス作成が容易になります。コンテンツ管理システムまたは現在のサイト設定によりこれが難しい場合は、rel=canonical 要素を使用して、特定のコンテンツを参照するために使用する URL を設定することができます。

元のタイトル: ウェブサイトを最適化すると検索エンジンがコンテンツをクロールしてインデックスしやすくなる理由の簡単な分析

キーワード: 検索エンジン

<<:  1 か月で毎日の IP を 1,000 から 20,000 に増やす方法

>>:  スパムの9つの種類を解明

推薦する

eBayが帰ってきました! CEOドナホーの5年間の業績回復の秘密

北京時間2月9日、eBay CEOのジョン・ドナホー氏は、かつて栄華を誇ったeBayを驚異的な復活へ...

openvirtuals - 年間 20 ドル / 512 MB メモリ / 180 GB ハード ドライブ / 2 TB トラフィック / 6 つのデータ センター

2011 年 6 月以来、OpenVirtuals は HostCat ブログに何度も登場しています...

SEOの基本を無視しないでください

SEO、この3つの簡単な言葉は、ウェブマスターが毎日目にする最も一般的な言葉だと思います。SEOを行...

SEOデータ分析はあなたの仕事を定量化することです

SEO はデータ分析から切り離すことはできません。データの裏付けがあって初めて説得力を持つことができ...

孫子の兵法に基づくネットワークマーケティング調査の5つの方法

孫子はこう言った。「将軍を勝利に導き、他の人よりも成功を達成できる者こそが預言者である。」オンライン...

小紅書のライブ放送が群衆を突破

トラックがますます混雑する中、半年前​​にライブストリーミングサービスを開始したXiaohongsh...

マーケティングの本質は私たちの日常生活の中にある

マーケティングの本当の意味は私たちの日常生活の中にあり、国内のマーケティングトレーニングマスターのト...

エッジコンピューティングは最高潮に達しました。 3大オペレーターがエッジ戦争でどう戦うか

Internet of Everything 時代の到来により、ネットワーク エッジ デバイスによっ...

新ブランド、非公開にしたくないIPマーケティング手法!

2019年、世界経済は回復し、成長しています。2019年の世界経済は5.5%成長し、中国の経済成長率...

オリジナルと疑似オリジナルの違いを知ることで、ソフトな記事でウェブサイトを宣伝しやすくなります。

SEO 業界では、ソフトな記事を使用して Web サイトを宣伝することが非常に重要です。SEO を行...

2023 年のクラウド コンピューティングのトップ 10 トレンド

クラウド コンピューティングは、ビジネスに不可欠なツールとなり、データを効率的に保存、共有する方法と...

宿題ヘルパー Kubernetes サーバーレス実装と大規模タスクシナリオでの最適化

1. 背景Zuoyebang のクラウドネイティブ コンテナ化変革のプロセスにおいて、さまざまなビジ...

ガートナー: 2019 年のパブリック クラウド サービスの 6 つのトレンド

2017 年から 2018 年にかけて、クラウド サービス市場は大きな変化を遂げました。組織は、クラ...

Amazon Web Services の機械学習が北京のダリッジ カレッジの授業に導入

北京ダリッジ・カレッジは、Amazon DeepRacer 自動運転レースカー、Amazon Ale...

コンテンツの再パッケージ化により、ウェブサイトのコンテンツがより目立つようになります

コンテンツの再パッケージ化は、最も強力なコンテンツ マーケティング戦略の 1 つです。この用語はあま...