主流の検索エンジンの原則

主流の検索エンジンの原則

今日は検索エンジンの原理を紹介します。まずは写真を見てみましょう…

次に、階層ごとに説明します。

1. www: www はインターネット上のすべてのウェブページを指します。世界にはいくつのウェブサイトがあるでしょうか? 2006 年の統計によると、ウェブサイトの数は 8,065 万でした。ここ数年のインターネットの急速な発展により、今日では数億のウェブサイトがあるはずです。検索エンジンの役割は、これらのウェブサイトを収集し、ユーザーが検索できるようにランキングを割り当てることです。

2. コレクター: コレクターは一般にスパイダーとして知られています。スパイダーはインターネット上の Web サイトのクロールを担当します。スパイダーには 2 つのクロール方法があり、1 つは深さ優先、もう 1 つは幅優先です。私の Web サイトを例に挙げると、深さ優先とは、スパイダーが Web ページで最初に見つけたリンクから開始することを意味します (下の図を参照)。最初のリンクの下にあるすべてのリンクがクロールされるまで、2 番目のリンクのクロールは開始されません。幅優先とは、2 番目のページのクロールを開始する前に、最初のページのすべてのリンクがクロールされることを意味します。

3. コントローラー: スパイダーは Web ページをダウンロードし、コントローラーに渡します。コントローラは、重複排除などのこれらの Web ページに対する簡単な分析を実行する役割を担います。また、コントローラは、スパイダーのディスパッチ、スパイダーのクロール時間、クロール方法、クロール オブジェクトなどの調整も担当します。コントローラーはすべての URL を抽出し、キャプチャされた URL とクロールされていない URL の 2 つのタイプに分割します。すべての URL ページをクロールし、元のデータベースに保存します。

4. オリジナル データベース: スパイダーによってキャプチャされたランキングのない、最もオリジナルな Web ページを保存するために使用されます。

5. Web ページ分析モジュール: Web ページ分析モジュールは最も重要なモジュールと言えます。この部分は主に、重複、詐欺、違法などのウェブサイトなどのジャンクウェブページをフィルタリングすることです。特に、Baiduアルゴリズムの最近の主要な更新後、この領域のアルゴリズムが更新され、主に偽のオリジナルやジャンクの外部リンクの収集に対抗するとともに、いくつかの複雑なアルゴリズムを使用して各ウェブページと外部リンクの価値をスコアリングします。これを重みと呼びます。この重みにより、将来のソートの準備が整います。

6. インデクサー: インデクサーは、Web ページ分析モジュールによって配信された貴重な Web ページを、順方向インデックスと逆方向インデックスに分割します。ポジティブインデックスとは、各 Web ページを多数のキーワードに分割することを意味します。逆インデックスは、キーワードごとに多数の Web ページをリストし、並べ替えます。

7. インデクサー データベース: インデックス データベースは、インデクサーによってキーワード別にリストされた Web ページを保存するために使用されます。

8. 検索エンジン: ユーザーが入力した単語をセグメント化し、インデックス データベースから Web ページを取得して並べ替え、最終的に結果をユーザーに返します。

9. ユーザー: 名前の通り、インターネット ユーザーです。

10. ユーザーインターフェース: Baidu の検索結果ページとして理解できます。

11. ユーザー行動ログデータベース: ユーザー行動ログデータベースは、ユーザーがクリックしたウェブサイト、ユーザーがウェブサイトに滞在した時間、2 番目のウェブサイトをクリックする間隔、検索キーワードなど、ユーザーの行動を保存するために使用されます。

12. ログ アナライザー: 個人的には、この部分は非常に重要だと思います。検索エンジンはユーザー エクスペリエンスにますます注目しており、これが今後の検索エンジンの開発傾向です。この部分は、ユーザー行動ログ データベースでユーザー行動を詳細に分析し、インターネット上の多くの Web サイトでのユーザー行動の重みとランキングを加算または減算します。

この記事は鄭州seoに掲載されました http://www.8abd.com/?p=65 転載の際はリンクを明記してください。 よろしくお願いいたします

元のタイトル: いくつかの主流検索エンジンの原理

キーワード: 検索エンジンの原理、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  7月のBaidu検索エンジンの変更の観察と概要

>>:  ソーシャルショッピングガイド:過大評価され、期待されている

推薦する

ランキング後もSEO最適化を継続する方法

最初の問題は、あなたのウェブサイトはランキングを持っていますが、キーワードが安定していないことです。...

2018年世界トップ10クラウドサービスプロバイダーデータセンター建設レイアウト海外クラウドサービス市場

2018 年の第 1 四半期が終わりに近づいていますが、クラウド サービス プロバイダーは時間をかけ...

海外マーケティング・プロモーションチャネル統合!

はじめに:現在も将来も、海外マーケティングには一定の市場があります。国内の機械設備業界、製造業、サー...

新疆のウェブマスターの皆様へ:9月15日には6,000以上のウェブサイトが登録抹消される予定です

以前、A5は、関連する専門資格が必要であるため、新疆のウェブマスターの登録が拒否されたと報じた。ウェ...

SEO担当者がビジネスオーナーとうまく付き合うための3つのステップ

現在、マクダルさんはサウナセンター建設会社のネットワーク部門で働いています。彼の仕事は上司から直接評...

HiTao.comは2年間休眠状態にあったが、Taobaoが支配株主となり、今年中に利益を上げることを目指す

新浪テクノロジー 神雲芳「競争には底線を引いてください」。2月28日正午、Jumei CEOのChe...

ソフト論文投稿における盗作被害を軽減する方法

宝くじサイトに記事を投稿していたとき、このことを深く理解しました。多くのサイトでは宝くじをセンシティ...

注目に値するコンテンツライティングテクニックをカウントダウン

記事はウェブサイトの生命線です。すべてのウェブサイトは記事で構成されていますが、うまく組み合わされて...

検索エンジン最適化チュートリアル (I): 検索エンジン最適化の理解

昨今のインターネットサーフィンで最も欠かせないものは何でしょうか?ウェブサイトのナビゲーションと言う...

vpsdime - 7 ドルで 3 つの VPS/大容量メモリ/大容量ハードドライブ/Windows

vpsdime は、6G メモリを搭載した大容量メモリ VPS、2G メモリと 500G ハードディ...

Green Radish アルゴリズム後のウェブサイトフレンドリーなリンク交換基準

Green Radish Algorithm のリリース後、多くのウェブサイトが格下げされたり、K ...

業界ポータルの生死: 懸念される運用モデル、あなたの将来はどこにありますか?

ネットマーケティングのプロモーションが商品の販売に及ぼす影響は、多くの中小企業経営者に希望の光を与え...

SEOサービスの専門的倫理と自己防衛

SEO ビジネスについて顧客と話し合うとき、顧客を見分ける能力を持つことは非常に重要です。ある程度の...

パーフェクトダイアリーのカードを台無しにしたのは誰ですか?

今年4月、疫病が流行する中、 Perfect Diary (別名「Yatsen E-Commerce...

7番目の叔母はK8sを理解しておらず、Chuanchangしか理解できません。

著者 |趙雲昨日は28日だったので、お花を飾りました。ここでは旧正月の雰囲気が漂っているので、クラウ...