検索エンジン技術の3つの核心問題

検索エンジン技術の3つの核心問題

月給5,000~50,000のこれらのプロジェクトはあなたの将来です

検索エンジン技術は私たち SEO 担当者が考慮すべきものではありませんが、それでも彼らがどのような問題を研究しているのかは理解しておく必要があります。今日、小小科堂 SEO 自習ネットワークは「検索エンジン技術の 3 つの核心問題」をお届けします。これが皆さんのお役に立てば幸いです。

1. 検索エンジンの関連性技術

①関連性の概念

検索エンジンは、ユーザーの検索用語とページ間の関連性を正確に判断し、関連性の強さに基づいてページ コレクションの初期スクリーニングと並べ替えを完了する必要があります。

②関連性分類

1) 検索語の関連性

検索エンジンは、まずユーザーのクエリの意味を判断する必要があります。同じ単語でも、状況によって意味が変わることがあるためです。意味を正しく判断して初めて、関連性が高いページをより適切に一致させることができます。判断が間違っていると、検索結果ページにユーザーが必要とするコンテンツが含まれない場合があり、ユーザーの検索エクスペリエンスが大幅に低下します。

たとえば、ユーザーが「apple」を検索すると、検索エンジンは iPhone の結果を表示しますが、ユーザーが実際に検索したいのは普通のリンゴだけである可能性があります。

もちろん、ほとんどの検索エンジンの結果に iPhone が表示されるのは正常です。なぜなら、ほとんどのユーザーが「Apple」という単語を検索するとき、その意味も iPhone だからです。もちろん、実際の Apple の結果ページもいくつか表示されます。

2) ユーザーの関連性

ユーザーが記事やウェブサイトを見たことがある場合、そのユーザーが特定の単語を検索すると、記事とウェブサイトのランキングが異なります。

ユーザーは、特定の分野の専門家、またはこの分野に頻繁に注目する愛好家です。このユーザーがこの分野で特定の単語を検索すると、複数回アクセスする Web サイトのランキングにプラスの影響を与える可能性があります。

もちろん、これらのユーザーの関連性は、SEO ではパーソナライズされた検索またはパーソナル検索と呼ばれることが多いものです。

③ 検索モデル

ユーザーの検索用語に対する Web ページの関連性を検索するために、検索エンジンの研究者はさまざまな検索モードを提案していますが、その中で最も広く使用されているのは「TF-IDF」です。

TF-IDF の核となる概念は、TF (キーワードの頻度または密度) と IDF (キーワードの逆文書頻度) の値をある程度まで高めることです。この 2 つの最終スコアが、ページの関連性を判断するための値となります。

簡単に言えば、キーワードの頻度や密度を高め、同時に百度内で関連する検索結果の数が少ない単語を探します。

2. 検索エンジン評価技術

検索エンジンの評価システムは非常に重要です。関連性の調査は、初期のスクリーニングと分類に過ぎませんが、それがユーザーが本当に期待するものかどうかは、評価システムを通じて完了する必要があります。

① ユーザーのクリックによって生成されるログデータ

検索エンジンは、ユーザーがクリックしたデータをバックグラウンドで記録し、大量のログデータを生成し、このデータを使用して検索エンジンを評価することができます。

②検索エンジン評価方法

その一つが、シリル・クレバードンの評価方法です。

評価には 2 種類の指標があります。

1) 正確性

精度とは、検索された文書のうち関連する文書の割合を指します。

2) 思い出す

再現率は、すべてのドキュメントの中で検出されたドキュメントの割合を指します。

3. 検索エンジンのユーザー検索エクスペリエンス技術

検索エンジンはユーザー指向であり、ユーザーの検索エクスペリエンスは検索エンジンの品質を評価する上で最も重要な要素の 1 つです。これが、検索エンジンが現在、ユーザーの検索エクスペリエンスを非常に重視している理由です。

検索エンジンはデータを使用して、どのページやウェブサイトがユーザーの検索エクスペリエンスに優れているかを分析し、ランキングやサイト全体の重み付けを改善できます。悪いエクスペリエンスを提供しているページやウェブサイトについては、ランキングやサイト全体の重み付けが低下します。

これは、Web サイトを最適化するときに、高いポイント対拡張率や UV よりもはるかに高い PV などのデータが、Web サイトのユーザー エクスペリエンスが優れていることを証明し、検索エンジンもそのような Web サイトに高いランキングを与えるようなものです。上記は、小小科堂 SEO 自習ネットワークがお届けする「検索エンジン技術の 3 つの核心問題」です。ご視聴ありがとうございました。 SEO トレーニングについては、Xiaoxiao Classroom をご覧ください。その他の SEO チュートリアルについては、Xiaoxiao Classroom を検索してください。オリジナル記事の転載は歓迎されており、著作権は留保されています。

原題: 検索エンジン技術の3つの核心問題

キーワード:

<<:  モーメントをスワイプすることがますます難しくなっている今日、これは突破口となるかもしれない

>>:  Toutiao が義烏に進出、数十万人のビジネスオーナーがインターネットマーケティングを習得できるように支援

推薦する

ネットワーク編集者の重要な資質についての簡単な議論

私はウェブ編集者として2年以上働いています。この職業は退屈すぎるという印象を持つ人が多いようです。ウ...

友情のつながりは量ではなく質が重要です!

ウェブサイトを外部から最適化する最も効果的な方法は、外部リンクを公開することです。そして、最も価値の...

2019年、世界のIaaSパブリッククラウドサービス市場は37.3%成長しました。

ガートナーによると、世界のインフラストラクチャ・アズ・ア・サービス(IaaS)市場は2018年の32...

ユーザーエクスペリエンスとは何ですか?それは、競合他社よりも早く問題点を発見し、迅速に解決することを意味します。

今日は小さな温度計から始めましょう。先週の夜、小規模なO2Oサロンに参加した後、屈強な男性が私を呼び...

第12回TOP100グローバルソフトウェアケーススタディサミットが北京で開催されました。

デジタル化とインテリジェンスの融合によってもたらされた競争の時代において、企業はサイクルを安全に乗り...

ICTイノベーションの成果は深まり続け、恒生電子は金融ICTイノベーションが多方面で着実に前進するのを支援しています。

金融業界は、国の重要なインフラ産業の一つとして、トップレベルの戦略と産業発展の二重の推進力の下、常に...

タオバオの中小販売業者の生活はますます悲惨になっています!それはすべてあなた自身のせいですか?

誰もが今同じような考えを持っているに違いありません。つまり、タオバオとTmallでビジネスをするのは...

Baidu は本当に事故による怪我に素早く反応するのだろうか。

みなさんこんにちは。私はShi Touです。今日、ホームページがK-edされた私のウェブサイトの一つ...

Tencent Cloud: 本日限定、素晴らしい、年間 74 元、4G メモリ/2 コア/80g SSD/8M 帯域幅

超朗報:テンセントクラウドがスーパーフラッシュセールを開始しました。これはほとんど素晴らしい慣行であ...

クラウドに移行する際にデータを安全に保つためのヒントとコツ

​翻訳者 |ブガッティ校正:孫淑娟安全かつ確実にクラウドに移行する方法を学びます。この記事では、移行...

クラウドコンピューティングがデータセンターを破壊しない理由

ご存知のとおり、クラウド コンピューティングが登場する前は、データ センターの運用は容易ではなかった...

timeweb: 13 年の歴史を持つブランド、100Mbps の帯域幅、無制限のトラフィック、VPS、月額 19 元

timeweb は Hostcat で 2 回紹介されています。興味があれば、以前の紹介を確認してく...

Kubernetes クラスターのネットワーク遅延問題をデバッグする方法

少し前に、同様の問題に遭遇しました。それは形而上学的な出来事のように思えました。当初、これはネットワ...

moonvmはどうですか?ハイネットデータセンターのダイナミックIP付き台湾VPSのレビュー

moonvm は 2017 年 3 月から台湾 VPS サービスを提供しています。デフォルトで動的 ...

nodeserv-7 USD/2 GB RAM/100 GB HDD/2 TB トラフィック/ジャクソンビル

2G メモリ、2G vswap、第 2 世代 OVZ は 4G メモリと見なすことができ、100G ...