検索エンジンの3つの主要な問題

検索エンジンの3つの主要な問題

1. ユーザーの真のニーズは何ですか?

検索エンジンのユーザーが入力するクエリは非常に短く、平均クエリ長は 2.7 語です。このような短いクエリリクエストの背後に隠された実際のユーザーニーズをどうやって知るのでしょうか? これは検索エンジンが最初に解決する必要がある非常に重要な問題です。ユーザーの真の検索意図を取得できない場合、その後のコンテンツ マッチング アルゴリズムが洗練されていても、検索の精度は問題外です。

別の観点から見ると、同じ検索語であっても、ユーザーによって検索目的が異なる場合があります。この違いをどのように識別するのでしょうか。さらに一歩進んで、同じ検索語が同じユーザーによって送信されたとしても、ユーザーの状況が異なるため、目的が異なる可能性があります。これをどのように識別するのでしょうか。これらはすべて、検索エンジンが解決する必要がある中核的な問題です。つまり、ユーザーがこの時間と場所でクエリを送信する場合、彼の本当の検索意図は何ですか。

2. ユーザーのニーズに本当に関連する情報は何ですか?

上記の最初の中核的な問題はユーザーのニーズの観点からのものであり、他の 2 つの中核的な問題はデータの観点から検討されています。検索エンジンは本質的にはマッチングプロセスであり、つまり大量のデータからユーザーのニーズに合ったコンテンツを見つけるプロセスです。したがって、ユーザーの真意を明らかにするという前提条件が満たされた後は、ユーザーのニーズを満たす情報をいかに見つけるかが重要な要素になります。

コンテンツとユーザーの検索キーワードの関連性を判断することは、情報検索の分野における中心的な研究テーマであり、提案されている情報検索モデルは、この問題を解決しようとしています。関連研究は60年近く続いています。新しい方法が絶えず提案され、全体的な検索効果は徐々に向上していますが、この分野の基本的な指導理念は、現在のすべての検索エンジンの関連性計算部分を含め、依然としてキーワードマッチングに基づいています。基本的な計算の考え方は、数十年前のものと根本的に変わりません。

3. ユーザーはどのような情報を信頼できますか?

検索の本質は、ユーザーのニーズを満たす情報を見つけることです。関連性は、情報がユーザーのニーズを満たしているかどうかを測定する上で重要な要素ですが、唯一の要素ではありません。情報が信頼できるかどうかも重要な基準です。

検索エンジンが処理する必要がある情報オブジェクトは、インターネット上の任意のユーザーが投稿したコンテンツですが、コンテンツ発行者が投稿したコンテンツが信頼できるかどうかを判断する明確な基準はありません。悪意のある情報発信者が故意に事実を歪曲するケースもあれば、情報発信者が意図せず間違いを犯すケースもあります。同じクエリの検索結果に矛盾する検索回答が存在する可能性は十分にあり、その場合、情報の信頼性が大きな問題になります。

リンク解析によって検索結果が向上する理由は、ある観点から見ると、情報の信頼性の判断ともいえます。つまり、Web ページの重要度は、信頼できるかどうかを判断する基準として使用されます。重要な Web ページを返すということは、信頼できる Web ページを返すことを意味します。

原題: 検索エンジンの3つの核心問題

キーワード: 検索、エンジン、3、コア、問題、ユーザー、実際、ニーズ、何、ウェブマスター、ウェブサイト、ウェブサイトのプロモーション、収益化

<<:  ウェブマスターネットワークからの毎日のレポート:電子商取引と物流企業が領土をめぐって競争、ハッカーは通信ネットワークに侵入したと主張

>>:  Gourmet.comは6年前に設立され、Baiduの失敗にもかかわらず、私はまだそれに取り組んでいます。

推薦する

クラウド支出を管理するための6つのヒント

一般的に、クラウド コンピューティングは、IT インフラストラクチャ、運用、保守、人件費を削減するこ...

123systems-1g メモリ XenPv/3T トラフィック/年間 30 ドル/G ポート

123systems はバレンタインデー前にプロモーションを実施し、2GB メモリ搭載の OVZ モ...

buyvm-6月はすべてオンライン

時代は変わりました。低価格 VPS リーダーは栄光を失いました。競争力のある価格ではなく、平均的なフ...

ビッグデータの専門家が、Zookeeper と Redis をベースにした分散ロックの実装方法を段階的に説明します。

[[282700]]分散システムでは、分散ロックを使用して複数のインスタンス間の同期の問題を解決しま...

分散時代が到来しました。データの価値を高めるにはどうすればよいでしょうか?

近年、デジタル技術の発展により、クラウドコンピューティングは再び変革の時代を迎えています。特に202...

weloveservers-$30/年/kvm/メモリ 1g/ハードディスク 30g/トラフィック 1T/ロサンゼルス/QuadraNet

weloveservers は 2016 年 1 月に初めて Hostcat に登場しました。1G ...

7月のBaidu検索エンジンの変更の観察と概要

最近、文章力が鈍ってきたので、Baidu 検索エンジンに関する最近の観察と私自身の小さな意見をまとめ...

raksmart: 無制限トラフィックの cn2 vps の 50% オフ プロモーション、および raksmart からの最新の VPS 評価データを提供します

Raksmartの「情熱的な初夏、5月の特別オファー「Gポート/無制限の超低価格1699は引き続き売...

Commvault が、完全かつスケーラブルなバックアップとリカバリ、最新のデータ管理を実現する 4 つの新しいポートフォリオを発表

[[237051]]エンタープライズ データのバックアップ、リカバリ、アーカイブ、クラウド サービス...

#ChineseNewYear# racknerd: 紅包抽選、直接現金割引、複数の格安 VPS、新しい Ryzen9 3900X+NVMe シリーズ VPS

2月8日から2月28日まで、racknerdは春節に向けた新しいイベントを開始します:(1) 昨年(...

インターネットはウォルマートに似ており、オンラインショッピングモールは主にワンストップサービスを推進している。

フォーチュン誌によって世界のトップ500にランクされているウォルマートは、世界で最初に「ワンストップ...

SEO最適化は評価期間中の記事コンテンツ構築の重要なポイントです - A5 Webmaster Network

皆さんご存知のとおり、新しいウェブサイトを立ち上げるときは、ウェブサイト構造の最適化、コラムの設定、...

Kubernetes ベースのハイブリッド クラウドの長所と短所

ハイブリッド クラウド プラットフォームは現在、Kubernetes ベースのクラウド プラットフォ...

限定版: crissic-1g メモリ/2ip/3 コア/50g ハードディスク/3t トラフィック

Crissic が特別セールを開始しました。今回の主力商品は KVM ですが、今回は特別限定版 KV...

ウェブサイトが閉鎖され、コンテンツが失われ、ランキングが下がってしまったらどうすればいいでしょうか?

数日前、当社はサーバーを提供していたパートナーと小さな衝突を起こしました。スペースプロバイダーは実際...