検索エンジン技術の3つの核心問題

検索エンジン技術の3つの核心問題

月給5,000~50,000のこれらのプロジェクトはあなたの将来です

検索エンジン技術は私たち SEO 担当者が考慮すべきものではありませんが、それでも彼らがどのような問題を研究しているのかは理解しておく必要があります。今日、小小科堂 SEO 自習ネットワークは「検索エンジン技術の 3 つの核心問題」をお届けします。これが皆さんのお役に立てば幸いです。

1. 検索エンジンの関連性技術

①関連性の概念

検索エンジンは、ユーザーの検索用語とページ間の関連性を正確に判断し、関連性の強さに基づいてページ コレクションの初期スクリーニングと並べ替えを完了する必要があります。

②関連性分類

1) 検索語の関連性

検索エンジンは、まずユーザーのクエリの意味を判断する必要があります。同じ単語でも、状況によって意味が変わることがあるためです。意味を正しく判断して初めて、関連性が高いページをより適切に一致させることができます。判断が間違っていると、検索結果ページにユーザーが必要とするコンテンツが含まれない場合があり、ユーザーの検索エクスペリエンスが大幅に低下します。

たとえば、ユーザーが「apple」を検索すると、検索エンジンは iPhone の結果を表示しますが、ユーザーが実際に検索したいのは普通のリンゴだけである可能性があります。

もちろん、ほとんどの検索エンジンの結果に iPhone が表示されるのは正常です。なぜなら、ほとんどのユーザーが「Apple」という単語を検索するとき、その意味も iPhone だからです。もちろん、実際の Apple の結果ページもいくつか表示されます。

2) ユーザーの関連性

ユーザーが記事やウェブサイトを見たことがある場合、そのユーザーが特定の単語を検索すると、記事とウェブサイトのランキングが異なります。

ユーザーは、特定の分野の専門家、またはこの分野に頻繁に注目する愛好家です。このユーザーがこの分野で特定の単語を検索すると、複数回アクセスする Web サイトのランキングにプラスの影響を与える可能性があります。

もちろん、これらのユーザーの関連性は、SEO ではパーソナライズされた検索またはパーソナル検索と呼ばれることが多いものです。

③ 検索モデル

ユーザーの検索用語に対する Web ページの関連性を検索するために、検索エンジンの研究者はさまざまな検索モードを提案していますが、その中で最も広く使用されているのは「TF-IDF」です。

TF-IDF の核となる概念は、TF (キーワードの頻度または密度) と IDF (キーワードの逆文書頻度) の値をある程度まで高めることです。この 2 つの最終スコアが、ページの関連性を判断するための値となります。

簡単に言えば、キーワードの頻度や密度を高め、同時に百度内で関連する検索結果の数が少ない単語を探します。

2. 検索エンジン評価技術

検索エンジンの評価システムは非常に重要です。関連性の調査は、初期のスクリーニングと分類に過ぎませんが、それがユーザーが本当に期待するものかどうかは、評価システムを通じて完了する必要があります。

① ユーザーのクリックによって生成されるログデータ

検索エンジンは、ユーザーがクリックしたデータをバックグラウンドで記録し、大量のログデータを生成し、このデータを使用して検索エンジンを評価することができます。

②検索エンジン評価方法

その一つが、シリル・クレバードンの評価方法です。

評価には 2 種類の指標があります。

1) 正確性

精度とは、検索された文書のうち関連する文書の割合を指します。

2) 思い出す

再現率は、すべてのドキュメントの中で検出されたドキュメントの割合を指します。

3. 検索エンジンのユーザー検索エクスペリエンス技術

検索エンジンはユーザー指向であり、ユーザーの検索エクスペリエンスは検索エンジンの品質を評価する上で最も重要な要素の 1 つです。これが、検索エンジンが現在、ユーザーの検索エクスペリエンスを非常に重視している理由です。

検索エンジンはデータを使用して、どのページやウェブサイトがユーザーの検索エクスペリエンスに優れているかを分析し、ランキングやサイト全体の重み付けを改善できます。悪いエクスペリエンスを提供しているページやウェブサイトについては、ランキングやサイト全体の重み付けが低下します。

これは、Web サイトを最適化するときに、高いポイント対拡張率や UV よりもはるかに高い PV などのデータが、Web サイトのユーザー エクスペリエンスが優れていることを証明し、検索エンジンもそのような Web サイトに高いランキングを与えるようなものです。上記は、小小科堂 SEO 自習ネットワークがお届けする「検索エンジン技術の 3 つの核心問題」です。ご視聴ありがとうございました。 SEO トレーニングについては、Xiaoxiao Classroom をご覧ください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

原題: 検索エンジン技術の3つの核心問題

キーワード:

<<:  モーメントをスワイプすることがますます難しくなっている今日、これは突破口となるかもしれない

>>:  Toutiao が義烏に進出、数十万人のビジネスオーナーがインターネットマーケティングを習得できるように支援

推薦する

Weiboマーケティングをうまく行う方法

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスインターネットの急速な発...

locvps: 新年特別キャンペーン「年払い小額プラン」、252元/年、2Gメモリ/1コア/20g SSD/400Gトラフィック、香港(3データセンター)/大阪、日本

locvps は新年に向けて特別オファーをご用意しました。年間支払いの小規模プランで 20% 割引 ...

Apache Kafka と SigNoz によるアプリケーションの可観測性

[[397257]] SigNoz は、開発者が最小限の労力で迅速に観測可能性の目標を達成できるよう...

thzvps: 香港のVPSの簡単なレビュー、3つのネットワークへの往復はCN2を使用し、月額40元と安い

thzvps(トークタウン)は、香港vpsと米国vps事業に特化し、安価なvps回線を使用する、設立...

テンセントが2020年のR&Dビッグデータレポートを発表:R&D人材が68%を占める

テンセントは3月18日、2020年の「テンセントR&Dビッグデータレポート」を正式に発表した。この報...

国内最大のクラウドコンピューティング市場セグメントであるSaaSの概要

1. SaaSの主な特徴IaaS と比較すると、SaaS は主に企業や個人の特定の情報ニーズを解決し...

WordPress ブログの購読者を増やす 5 つの方法

しかし、購読者がたくさんいても、記事にコメントする人が誰もいない場合は、カウントされません。そこで、...

ユーザーエクスペリエンス: アイトラッキング研究の紹介、応用価値と問題点

ユーザーエクスペリエンスの向上と技術機器の進歩により、眼球運動の研究はますます知られるようになり、国...

Hostsailor - 生涯割引コード 15% オフ / ルーマニア サーバー

Hostsailorは最近、ルーマニアの独立サーバーの購入にのみ適用される15%オフの生涯割引コード...

QingCube Qing3ハイパーコンバージドシステムは、中国のハイパーコンバージド市場でトップ5にランクされており、IDCレポートに連続して掲載されています。

最近、IDCが発表した「中国のソフトウェア定義ストレージおよびハイパーコンバージド市場追跡調査レポー...

ウェブマスターネットワークニュース: オンライン著作権侵害対策開始、360 度モバイル検索が公開

1. B2B 電子商取引の将来はどこへ向かうのでしょうか?現在、大規模な総合B2Bサービスプラットフ...

ウェブマスターネットワークからの毎日のレポート:Qunarの資金調達とAlipay情報の抜け穴が論争を巻き起こす

1. セルフメディアは収益モデルを見つけるのに苦労している:持続可能な開発が重要有名なセルフメディア...

Google、スマートフォン検索ランキングを変更

Googleの公式ブログによると、スマートフォンユーザーはインターネットユーザーの増加が最も著しい市...

SEOに対する何もしないアプローチについて

SEOは必要ですか?ウェブマスターのウェブサイトで次のような記事を見ました: 「最適化しないことが最...

Q&Aマーケティングを行う際にBaiduしか知りませんか?それではアウトです

オンライン マーケティングを行う人は誰でも、質疑応答マーケティングについて知っておく必要があります。...