検索エンジンの仕組み

検索エンジンの仕組み

全文検索エンジン

検索エンジンの分類のセクションでは、Web サイトから情報を抽出して Web ページ データベースを構築する全文検索エンジンの概念について説明しました。

通常検索

検索エンジンの自動情報収集機能には2種類あります。 1 つは定期的な検索です。つまり、定期的に (たとえば、Google は通常 28 日)、検索エンジンが「スパイダー」プログラムを積極的に送信して、特定の IP アドレス範囲内のインターネット サイトを検索します。新しい Web サイトが見つかると、検索エンジンは自動的に Web サイトの情報と URL を抽出し、独自のデータベースに追加します。

サイト検索を送信

もう 1 つは、ウェブサイト検索を送信する方法です。つまり、ウェブサイトの所有者が URL を検索エンジンに積極的に送信します。一定期間内 (2 日から数か月まで) に、検索エンジンは「スパイダー」プログラムをウェブサイトに送信してウェブサイトをスキャンし、ユーザーのクエリに関連する情報をデータベースに保存します。近年、検索エンジンのインデックスルールは大きく変化したため、URL を積極的に送信しても、Web サイトが検索エンジンのデータベースに登録される保証はありません。したがって、現時点での最善の方法は、より多くの外部リンクを取得して、検索エンジンがあなたを見つけて Web サイトを自動的に含める機会を増やすことです。

ユーザーがキーワードを使用して情報を検索すると、検索エンジンはデータベースを検索します。ユーザーの要件に一致するWebサイトが見つかった場合、特別なアルゴリズムを使用して、Webページ内のキーワードの一致度、出現場所/頻度、リンクの品質などに基づいて各Webページの関連性とランキングを計算し、関連性に応じてWebページのリンクを順番にユーザーに返します。

カタログインデックス

ディレクトリ インデックスは、全文検索エンジンと比べて多くの違いがあります。

まず、検索エンジンはウェブサイトを自動的に検索しますが、ディレクトリのインデックス作成は完全に手動操作に依存します。

ユーザーが Web サイトを送信すると、ディレクトリ エディターが Web サイトを実際に閲覧し、独自の評価基準やエディターの主観的な印象に基づいて Web サイトを受け入れるかどうかを決定します。

第二に、検索エンジンにウェブサイトが含まれている場合、そのウェブサイト自体が関連規則に違反していない限り、通常は正常にログインできます。

一方、ディレクトリのインデックス作成では、Web サイトに非常に高い負荷がかかるため、複数回ログインしても成功しない場合があります。特にYahoo!のようなスーパーインデックスの場合、ログインはさらに困難になります。 (Yahoo!へのログインは最も難しく、企業のオンラインマーケティングの激戦区でもあるため、後ほど特設コーナーでYahoo!へのログインのコツを紹介する予定です。)また、検索エンジンにログインする場合は、通常、Web サイトの分類を考慮する必要はありませんが、ディレクトリ インデックスにログインする場合は、Web サイトを最も適切なディレクトリ (Directory) に配置する必要があります。

情報の抽出

最後に、検索エンジン内の各ウェブサイトの関連情報はユーザーのウェブページから自動的に抽出されるため、ユーザーの観点からはより自律性があります。一方、ディレクトリインデックスではウェブサイト情報を手動で入力する必要があり、さまざまな制限があります。さらに、スタッフが、あなたが提出したウェブサイトのディレクトリとウェブサイト情報が不適切であると判断した場合、もちろん事前にあなたと話し合うことなく、いつでもそれを調整することができます。

ディレクトリインデックスは、その名の通り、ウェブサイトをカテゴリ別に該当するディレクトリに保存することです。そのため、ユーザーが情報を照会する際には、キーワード検索を選択したり、カテゴリディレクトリに従って階層ごとに検索したりすることができます。キーワードで検索すると、検索エンジンと同じ結果が返され、情報の関連度に応じてウェブサイトがランク付けされますが、より多くの人的要素が関係します。階層ディレクトリで検索する場合、ディレクトリ内のウェブサイトの順位はタイトルのアルファベット順で決まります(例外もあります)。

現在、検索エンジンとディレクトリインデックスは相互に統合・浸透する傾向にあります。

純粋な全文検索エンジンの中には、ディレクトリ検索も提供するものがあります。たとえば、Google は Open Directory を使用して分類検索を提供しています。 Yahoo! のような旧来のディレクトリ インデックスは、Google などの検索エンジンと提携することで検索範囲を拡大してきました。デフォルトの検索モードでは、中国の Sohu、Sina、NetEase など、一部のディレクトリ検索エンジンは、最初に独自のディレクトリ内の一致する Web サイトを返しますが、Yahoo など、他の検索エンジンはデフォルトで Web 検索を返します。

早めにこのサイトに連絡して、お名前をお知らせください。連絡先メールアドレス: mb5u#vip.qq.com (# を @ に変更してください)。

元のタイトル: 検索エンジンの仕組み

キーワード: 検索エンジン

<<:  検索エンジン最適化の詳細

>>:  最適化のアイデア: 検索エンジンアルゴリズムのコピーウェブページ

推薦する

草の根ウェブマスターとしての5年間の経験のまとめ:ウェブサイトから利益を得ることに成功

インターネットは近年、継続的に発展しています。私は夜更かししてプログラムを調整したことを思い出し、世...

ネットワークマーケティングにおける最も重要な動き

序文: 昨晩統計をとったとき、実は秘密にしていました。「インターネット マーケティングで最も重要な動...

香港サーバー: zenlayer、30% 割引、1Gbps 香港 CN2 GIA 大帯域幅、月額 181 ドルから

世界的に有名なデータセンターであるZenlayerも香港に独自のデータセンターを持ち、デフォルトの帯...

外部リンクの性質を理解し、ウェブサイトのプロモーションを心配する必要はありません

ほとんどのウェブマスターにとって、外部リンクは非常に重要であると考えられています。アルゴリズムは何度...

【ピークシーズン戦略2】初心者セラー向けSEOのヒント:キーワードの重みを向上させる鍵とは?

私の前回の記事を読んだ販売者はすでに SEO の原則と重要性について大まかに理解しているはずです。今...

クラウドにも独自のネットワークが必要です。 SDNとVPCの存在

クラウド コンピューティングを水資源に例えると、クラウド ネットワークは蛇口のようなものです。クラウ...

VM レベルでの災害復旧の課題は何ですか?

VM 災害復旧は物理的な DR 手法に比べて画期的なものです。しかし、遅く、柔軟性に欠け、潜在的な欠...

P2Pオンライン融資はしばしば損益に打撃を与える:規制当局はインターネット金融に関する新たな政策を策定中

パン・ファーウェイ・デン・シェン過去 1 か月間で、プラットフォームの閉鎖がますます頻繁になりました...

SEOアウトソーシングサービスはますます人気が高まっています

検索エンジンのアルゴリズムが何度もアップグレードされ、改善されるにつれて、中国の SEO 市場はます...

ショップをロングテールキーワードとして使用してトラフィックを独占する

ホームページに主要キーワードを配置した後、獲得できる注文数が予想ほど多くないことがわかりました。これ...

ウェブサイトのトラフィックを増やすための4つの効果的な方法を紹介します

すべてのウェブマスターはウェブサイトを構築できますが、それを運用し、大量のトラフィックをもたらす方法...