検索エンジン技術の3つの核心問題

検索エンジン技術の3つの核心問題

月給5,000~50,000のこれらのプロジェクトはあなたの将来です

検索エンジン技術は私たち SEO 担当者が考慮すべきものではありませんが、それでも彼らがどのような問題を研究しているのかは理解しておく必要があります。今日、小小科堂 SEO 自習ネットワークは「検索エンジン技術の 3 つの核心問題」をお届けします。これが皆さんのお役に立てば幸いです。

1. 検索エンジンの関連性技術

①関連性の概念

検索エンジンは、ユーザーの検索用語とページ間の関連性を正確に判断し、関連性の強さに基づいてページ コレクションの初期スクリーニングと並べ替えを完了する必要があります。

②関連性分類

1) 検索語の関連性

検索エンジンは、まずユーザーのクエリの意味を判断する必要があります。同じ単語でも、状況によって意味が変わることがあるためです。意味を正しく判断して初めて、関連性が高いページをより適切に一致させることができます。判断が間違っていると、検索結果ページにユーザーが必要とするコンテンツが含まれない場合があり、ユーザーの検索エクスペリエンスが大幅に低下します。

たとえば、ユーザーが「apple」を検索すると、検索エンジンは iPhone の結果を表示しますが、ユーザーが実際に検索したいのは普通のリンゴだけである可能性があります。

もちろん、ほとんどの検索エンジンの結果に iPhone が表示されるのは正常です。なぜなら、ほとんどのユーザーが「Apple」という単語を検索するとき、その意味も iPhone だからです。もちろん、実際の Apple の結果ページもいくつか表示されます。

2) ユーザーの関連性

ユーザーが記事やウェブサイトを見たことがある場合、そのユーザーが特定の単語を検索すると、記事とウェブサイトのランキングが異なります。

ユーザーは、特定の分野の専門家、またはこの分野に頻繁に注目する愛好家です。このユーザーがこの分野で特定の単語を検索すると、複数回アクセスする Web サイトのランキングにプラスの影響を与える可能性があります。

もちろん、これらのユーザーの関連性は、SEO ではパーソナライズされた検索またはパーソナル検索と呼ばれることが多いものです。

③ 検索モデル

ユーザーの検索用語に対する Web ページの関連性を検索するために、検索エンジンの研究者はさまざまな検索モードを提案していますが、その中で最も広く使用されているのは「TF-IDF」です。

TF-IDF の核となる概念は、TF (キーワードの頻度または密度) と IDF (キーワードの逆文書頻度) の値をある程度まで高めることです。この 2 つの最終スコアが、ページの関連性を判断するための値となります。

簡単に言えば、キーワードの頻度や密度を高め、同時に百度内で関連する検索結果の数が少ない単語を探します。

2. 検索エンジン評価技術

検索エンジンの評価システムは非常に重要です。関連性の調査は、初期のスクリーニングと分類に過ぎませんが、それがユーザーが本当に期待するものかどうかは、評価システムを通じて完了する必要があります。

① ユーザーのクリックによって生成されるログデータ

検索エンジンは、ユーザーがクリックしたデータをバックグラウンドで記録し、大量のログデータを生成し、このデータを使用して検索エンジンを評価することができます。

②検索エンジン評価方法

その一つが、シリル・クレバードンの評価方法です。

評価には 2 種類の指標があります。

1) 正確性

精度とは、検索された文書のうち関連する文書の割合を指します。

2) 思い出す

再現率は、すべてのドキュメントの中で検出されたドキュメントの割合を指します。

3. 検索エンジンのユーザー検索エクスペリエンス技術

検索エンジンはユーザー指向であり、ユーザーの検索エクスペリエンスは検索エンジンの品質を評価する上で最も重要な要素の 1 つです。これが、検索エンジンが現在、ユーザーの検索エクスペリエンスを非常に重視している理由です。

検索エンジンはデータを使用して、どのページやウェブサイトがユーザーの検索エクスペリエンスに優れているかを分析し、ランキングやサイト全体の重み付けを改善できます。悪いエクスペリエンスを提供しているページやウェブサイトについては、ランキングやサイト全体の重み付けが低下します。

これは、Web サイトを最適化するときに、高いポイント対拡張率や UV よりもはるかに高い PV などのデータが、Web サイトのユーザー エクスペリエンスが優れていることを証明し、検索エンジンもそのような Web サイトに高いランキングを与えるようなものです。上記は、小小科堂 SEO 自習ネットワークがお届けする「検索エンジン技術の 3 つの核心問題」です。ご視聴ありがとうございました。 SEO トレーニングについては、Xiaoxiao Classroom をご覧ください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

原題: 検索エンジン技術の3つの核心問題

キーワード:

<<:  モーメントをスワイプすることがますます難しくなっている今日、これは突破口となるかもしれない

>>:  Toutiao が義烏に進出、数十万人のビジネスオーナーがインターネットマーケティングを習得できるように支援

推薦する

HarmonyOS基本技術により実現した分散データサービス機能

[[419727]]詳細については、以下をご覧ください。 51CTOとHuaweiが共同で構築したH...

YOHO! Youhuo: ファッションメディアはどのようにして電子商取引を成功させるのでしょうか?

ファッション情報に詳しいおしゃれな男性・女性なら、YOHO をご存知でしょう。この流行の e コマー...

Red Hat Enterprise Linux 6.10 がリリースされ、ミッションクリティカルな安定性が向上

オープンソース ソリューションの世界的な大手プロバイダーである Red Hat, Inc. (NYS...

デジタル時代において、SaaS ソフトウェアはどのようにして国内代替の軽騎兵隊になれるのでしょうか?

大国間の試合は技術力の競争です。海の向こうの米国がファーウェイを筆頭とする中国のハイテク企業に対して...

海外でも使いやすい格安クラウドホストをおすすめします

安価なクラウド ホストは数多くあり、特に海外のホストでは価格が驚くほど安い場合があります。しかし、信...

2010年5月18日のBaiduスナップショットの更新日は間違っている

サイトナビゲーションネットワークのリーダーは、Baiduに「中央ラジオテレビ大学の登録電話番号」を入...

WeChatマーケティングでファンを増やすにはどうすればいいですか?

WeChatマーケティングでファンを増やすにはどうすればいいですか?これはほとんどの人が懸念している...

ウェブサイトで優れたユーザーエクスペリエンスを実現するための 5 つのヒント

Appleのおかげで、今日の製品やアプリケーションはますますユーザーエクスペリエンスに重点を置くよう...

SEO の方法 高品質のソフトテキストはどのくらいの重みを占めるか - A5 Webmaster Network

多くのウェブサイトビルダーは、SEO という略語に精通しています。なぜなら、ウェブサイトビルダーはこ...

クラウドコンピューティングのデータ保護状態を改善する方法

現在、ほとんどのデータ保護ソリューションは、オンプレミスのデータ保護インフラストラクチャのコストを削...

おすすめ: host1plus-50% 割引コード/VPS クラウド/10g ポート/カスタム ISO/ワンクリック バックアップ/Alipay

host1plus のクラウド サーバーは 2 つの新機能を追加し、50% 割引プロモーションを発表...

中間レビュー: 2022 年に注目すべきクラウド コンピューティング スタートアップ 10 社

企業がかつてない速さでクラウド コンピューティングに群がる中、数多くのクラウド コンピューティングの...

iniz シンガポール VPS シンプルレビュー/ネットワークが若干改善

数年前から存在している VPS ブランドである iniz.com は、誰もがよく知っていると思います...

2012年は医療業界にとって百度の「審判の日」となるのか?

最新の報道によると、百度百科事典はすべての医療項目に専門認証を導入する。一般ユーザーは編集に参加でき...

SARFTはテレビ番組や広告にインターネット用語の使用禁止を義務付ける

昨日、国家新聞出版広電総局は関連通知を発表し、各種ラジオ・テレビ番組や広告は、国家共通語の文字、単語...