初心者向け SEO の概念: クロールとインデックスの違い

初心者向け SEO の概念: クロールとインデックスの違い

クロールとインデックス作成は、SEO における 2 つの専門用語です。多くの初心者は SEO に触れると、この 2 つの単語を混同し、クロールとインデックス作成を同じものだと考えてしまいます。今日は、クロールとインデックスの違いについて詳しく説明します。

1. 這う

検索エンジンのスパイダーがサイトをクロールする場合、クロールされるサイト内の URL は 1 つだけです。検索エンジンは他の Web ページからのリンクを追跡してこのサイトにクロールできるため、クロールとは、検索エンジンがリンクに従ってサイトの特定の URL をクロールすることを意味します。

上記の概念は少し抽象的かもしれませんので、例を挙げて簡単に説明しましょう。たとえば、多くの場合、スパイダーがサイトをクロールしているとき、サイト内の次のようなリンクはクロールできません。

(1)リンクのエンコーディングはJavascriptです。これは「スパイダートラップ」と呼ばれ、サイトをクロールするときにスパイダーがこれらのリンクのクロールを自動的にブロックします。

(2)リンクはrobots.txtで「禁止」指示としてマークされています。

(3)孤立したリンク(誰も貼っていないsitemaps.xml、このようなリンクを含む)

(4)リンク先のページがリンクnofollow指示を含むページである

(5)このリンクは本来クロールされる予定でしたが、サーバーの不安定さのためクロールできませんでした。

2. 索引

インデックス作成とクロールの最大の違いは、インデックス作成は特定の URL をクロールするのではなく、ページ内の多数の URL をクロールすることです。簡単に言うと、検索エンジンはどのページをインデックスするかを決定すると、このページ内のすべての URL を処理してクロールします。クロール プロセス中、スパイダーはページの内容に基づいて適切な処理を実行します。簡単な例を挙げると、一部のページのコンテンツに URL がありますが、この URL に NOINDEX ディレクティブが追加されている場合、検索エンジンはこのページをクロールしません。

サイトのページがインデックスに登録されない理由:

(1)ページにNOINDEXディレクティブ()が含まれている

(2)重複コンテンツ:同じコンテンツのページはインデックスされない場合があります。

(3)その他の理由:リンク年齢とリンク人気

初心者がサイト内のどのページがインデックスされているかを知りたい場合は、「サイト + ウェブサイトのドメイン名」で検索できます。このようにして、検索エンジンはスパイダーによってインデックスされているページ数と、それがどのページであるかを表示します。

クローリングとインデックス作成はどちらもスパイダーがサイトを巡回することを指しますが、その指示は異なります。ここでは、これらを区別するために注意することをお勧めします。

この記事はもともと http://www.jiaodahaiwai.net に掲載され、最初に A5 に掲載されました。転載する際は有効なリンク アドレスをそのままにしておいてください。ありがとうございます!

元のタイトル: 初心者向け SEO の概念: クロールとインデックスの違い

キーワード: 初心者、SEO、コンセプト、クロール、インデックス、2、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  5月のCNドメイン名の成長率は4%で、これは個人登録の開始によって若干影響を受ける可能性がある。

>>:  Dangdangはコミュニティマーケティングを模索し、Pinterestのようなプラットフォームを立ち上げる

推薦する

成果報酬型 SEO サービスですか?

「成果報酬型」ビジネスモデルは、これまでも多くの人に話題にされてきました。GoogleやBaiduの...

スマートファクトリーは、企業が「製造」から「インテリジェント製造」に移行するのを支援します。

インテリジェント製造は新産業革命の「魂」ですが、その核心は、高品質の設備やより高度な技術をいかに獲得...

ポルノグラフィーおよび違法出版物対策国家事務所は8つの典型的な事例を報告し、多くの文学小説のウェブサイトがリストアップされた。

国家ポルノ・違法出版取締局が報告した8件の事件(表参照)のうち、黒竜江省ハルビン市でわいせつな資料を...

フォーラムを使用してロングテールキーワードをランク​​付けする方法

業界のキーワードをランク​​付けするためにフォーラムを運営し始めるウェブマスターが増えていますが、多...

分散スケジュールタスクの弾性ジョブのジョブシャーディング戦略について話しましょう

実際の開発では、定期的にバッチを実行し、1 日に 1 回調整操作を実行する必要があるシナリオに遭遇す...

アリババクラウドが東方明珠塔を「ライトアップ」し、IoT都市の洗練された管理モデルを共同で構築

アリババクラウドは6月7日、2018年雲啓会議上海サミットにおいて、東方明珠新メディア有限公司(以下...

機密情報ウェブサイトを宣伝する際に注意すべき点がいくつかあります。

武漢の SEO も他の SEO と同じです。毎日、いくつかの分類情報プラットフォームに戻って、会社の...

24 Dockerfileと指示のベストプラクティス

キャッシュを構築するイメージ構築プロセス中、Docker は Dockerfile で指定された順序...

「ビッグバン・セオリー」などのアメリカのテレビシリーズが棚から撤去された

新浪科技によると、「ビッグ・リボウスキ」や「グッド・ワイフ」など、いくつかのアメリカのテレビシリーズ...

国家医療局長は、オンライン診療は違法な医療行為であると述べた。

記者 李静 インターン 劉百坤/北京レポートインターネット時代では、人々は医者に診てもらうためにもオ...

テンセントクラウドTDSQLは完全に自社開発した新しいアジャイルエンジンでデータベースのローカライズを促進

[51CTO.comからのオリジナル記事] デジタル経済の全面的な発展により、銀行には前例のないオン...

データ共有: arkecxクラウドサーバーのシカゴデータセンターの簡単な評価

arkecxはどうですか? Zenlayer直系のクラウドサーバーブランドとして、期待が高まっている...

「90 Webmaster Forum」はなぜ15日で閉鎖されたのでしょうか?

皆さんご存知のとおり、今年6月からBaidu Kステーションは強力な存在となり、検索エンジンのスパイ...

Web 2.0コミュニティの平等性について:Zhihuはユーザーを追い払い、Doubanはユーザーを引き付ける

Douban と Zhihu は、国内の Web 2.0 サイトの 2 つのベンチマークです。しかし...

swissnode-$6.2/メモリ2g/ハードディスク150g/トラフィック2T/スイス

swissnode.chは今年8月に設立されたようです。ウェブサイトには電話番号と住所がありますが、...