検索エンジン技術の3つの核心問題

検索エンジン技術の3つの核心問題

月給5,000~50,000のこれらのプロジェクトはあなたの将来です

検索エンジン技術は私たち SEO 担当者が考慮すべきものではありませんが、それでも彼らがどのような問題を研究しているのかは理解しておく必要があります。今日、小小科堂 SEO 自習ネットワークは「検索エンジン技術の 3 つの核心問題」をお届けします。これが皆さんのお役に立てば幸いです。

1. 検索エンジンの関連性技術

①関連性の概念

検索エンジンは、ユーザーの検索用語とページ間の関連性を正確に判断し、関連性の強さに基づいてページ コレクションの初期スクリーニングと並べ替えを完了する必要があります。

②関連性分類

1) 検索語の関連性

検索エンジンは、まずユーザーのクエリの意味を判断する必要があります。同じ単語でも、状況によって意味が変わることがあるためです。意味を正しく判断して初めて、関連性が高いページをより適切に一致させることができます。判断が間違っていると、検索結果ページにユーザーが必要とするコンテンツが含まれない場合があり、ユーザーの検索エクスペリエンスが大幅に低下します。

たとえば、ユーザーが「apple」を検索すると、検索エンジンは iPhone の結果を表示しますが、ユーザーが実際に検索したいのは普通のリンゴだけである可能性があります。

もちろん、ほとんどの検索エンジンの結果に iPhone が表示されるのは正常です。なぜなら、ほとんどのユーザーが「Apple」という単語を検索するとき、その意味も iPhone だからです。もちろん、実際の Apple の結果ページもいくつか表示されます。

2) ユーザーの関連性

ユーザーが記事やウェブサイトを見たことがある場合、そのユーザーが特定の単語を検索すると、記事とウェブサイトのランキングが異なります。

ユーザーは、特定の分野の専門家、またはこの分野に頻繁に注目する愛好家です。このユーザーがこの分野で特定の単語を検索すると、複数回アクセスする Web サイトのランキングにプラスの影響を与える可能性があります。

もちろん、これらのユーザーの関連性は、SEO ではパーソナライズされた検索またはパーソナル検索と呼ばれることが多いものです。

③ 検索モデル

ユーザーの検索用語に対する Web ページの関連性を検索するために、検索エンジンの研究者はさまざまな検索モードを提案していますが、その中で最も広く使用されているのは「TF-IDF」です。

TF-IDF の核となる概念は、TF (キーワードの頻度または密度) と IDF (キーワードの逆文書頻度) の値をある程度まで高めることです。この 2 つの最終スコアが、ページの関連性を判断するための値となります。

簡単に言えば、キーワードの頻度や密度を高め、同時に百度内で関連する検索結果の数が少ない単語を探します。

2. 検索エンジン評価技術

検索エンジンの評価システムは非常に重要です。関連性の調査は、初期のスクリーニングと分類に過ぎませんが、それがユーザーが本当に期待するものかどうかは、評価システムを通じて完了する必要があります。

① ユーザーのクリックによって生成されるログデータ

検索エンジンは、ユーザーがクリックしたデータをバックグラウンドで記録し、大量のログデータを生成し、このデータを使用して検索エンジンを評価することができます。

②検索エンジン評価方法

その一つが、シリル・クレバードンの評価方法です。

評価には 2 種類の指標があります。

1) 正確性

精度とは、検索された文書のうち関連する文書の割合を指します。

2) 思い出す

再現率は、すべてのドキュメントの中で検出されたドキュメントの割合を指します。

3. 検索エンジンのユーザー検索エクスペリエンス技術

検索エンジンはユーザー指向であり、ユーザーの検索エクスペリエンスは検索エンジンの品質を評価する上で最も重要な要素の 1 つです。これが、検索エンジンが現在、ユーザーの検索エクスペリエンスを非常に重視している理由です。

検索エンジンはデータを使用して、どのページやウェブサイトがユーザーの検索エクスペリエンスに優れているかを分析し、ランキングやサイト全体の重み付けを改善できます。悪いエクスペリエンスを提供しているページやウェブサイトについては、ランキングやサイト全体の重み付けが低下します。

これは、Web サイトを最適化するときに、高いポイント対拡張率や UV よりもはるかに高い PV などのデータが、Web サイトのユーザー エクスペリエンスが優れていることを証明し、検索エンジンもそのような Web サイトに高いランキングを与えるようなものです。上記は、小小科堂 SEO 自習ネットワークがお届けする「検索エンジン技術の 3 つの核心問題」です。ご視聴ありがとうございました。 SEO トレーニングについては、Xiaoxiao Classroom をご覧ください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

原題: 検索エンジン技術の3つの核心問題

キーワード:

<<:  モーメントをスワイプすることがますます難しくなっている今日、これは突破口となるかもしれない

>>:  Toutiao が義烏に進出、数十万人のビジネスオーナーがインターネットマーケティングを習得できるように支援

推薦する

ソフト記事プロモーション:「ジェット・リー」と「スティーブン・チョウ」から、IPマーケティングの正しい遊び方を解説!

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています認めるかど...

2018年の米国越境電子商取引市場の概要

本稿では、地域経済発展の現状と展望、消費者の洞察、ソーシャルメディアマーケティングのレイアウト、主要...

DevOps 実装の核心と 13 の経験のまとめ

前回の記事では、Devops の概念と、Devops を適用することで企業がもたらすメリットについて...

2017 年ボリュームゲーム購入に関する年次ホワイトペーパー

2017年はゲーム業界の競争が激化した年でした。広告主は大きなプレッシャーを感じており、ユーザー獲得...

ShanglongがChinaHR.comを買収:統合の難しさを過小評価すべきではない

「経営陣が入れ替わると思っていましたが、買収前にChinaHR.comがあれほど騒ぎ立てていたことを...

企業にとってのクラウド コンピューティングの 10 のメリット

今日では、企業内のデータセンターはもはや人気がありません。もちろん、企業にはバックアップとしてデータ...

WeChatは「肥大化」しつつあるのか?

今年のWeChatは例年になく活発なようです。年初のビデオアカウント、年半ばの「Tap Tap」から...

SEO のキャリアプランニング、SEO に将来はあるのでしょうか?

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますすべての専...

最高の鋼は最も柔らかい鋼:タオバオアフィリエイトサイトのキラー機能を解読する

2012 年は Taobao アフィリエイトにとって重要な年であると考えられます。さまざまな Tao...

広告によって飼いならされたインターネット

本稿では、インターネット広告とインターネット生態系の関係から出発し、ユーザーがインターネット広告に飼...

北京のウェブサイト60件がポルノコンテンツに関する調査を受けて閉鎖され、8件のウェブサイトが登録抹消された。

文化資本を構築し、文化市場を浄化することが急務です。記者が昨日知ったところによると、12月20日現在...

クリーンアプローチによってコードがより明確でシンプルになり、強力になる理由

この記事は、プログラマー必読の書籍の 1 つとされる「Clean Code」の第 1 章から抜粋した...

chicagovps ボスの誕生日、openvz-512M メモリの月額支払い 2 ドル

主人公が戻ってきました。chicagovps のボスの誕生日です。512M メモリの openvz ...

多国籍企業がベンチャーキャピタル業界に参入:もはやインターネットに大金を賭けることはない

MMVゼネラルマネージャーのハスル・サンジ氏(写真提供:テンセントテクノロジー)テンセントテクノロジ...

エッジ コンピューティング ワークロード: VM、コンテナー、それともベアメタル?

私たちはコネクティビティとスマートデバイスの時代に生きています。スマートデバイスの数が増加するにつれ...