序文: これは Bing のコア検索研究開発部門のマネージャーによる記事です。この記事では、Bing の一連の機能改善について説明しています。これは検索機能の改善に関する一般的な紹介にすぎませんが、この記事を読んだ後、検索エンジンは、人々が検索するときに犯す間違い、ユーザーの意図を正しく理解する方法、語彙を使用してより正確なコンテンツを提供することに多くのエネルギーを注いでいることがわかります。そのため、Lu Songsong 氏は、Bing、Google、Baidu のいずれであっても、同じことをするだろうと考えています。 Bing では、可能な限り最高の検索結果を提供することに注力しています。Bing のコア検索およびランキング アルゴリズムは、データ マイニングの専門家チームによって継続的に改善されていますが、実際には、歴史的に欠陥が常に存在しています。これは、検索に頼りすぎるとユーザーが犯す間違いが原因の一部です。この記事では、同僚で Bing の研究開発マネージャーである Bill Ramsey が、URL クエリ、フォロー リンク、関連検索の 3 つの領域における欠陥の発生率と重大性について説明します。 一般的な URL クエリ エラー これは検索の欠陥の主な原因の 1 つであり、「facebook.com」や「yahoo website/mail」などの URL クエリと呼ばれるものに関係しており、一見すると単純な問題と思われるかもしれません。結局のところ、検索エンジン (Bing) には数十億の URL が含まれているため、一致する Web サイトを見つけるのは難しくありません。しかし、実際には、このタイプのクエリは非常に複雑です。なぜなら、私たちは皆、数え切れないほどのスペルやバリエーションを使用しているからです。 たとえば、「facebook.com」には「facebookc.om」、「facbook.com」、「ww.faceboo.omc」など何千もの異なるバリエーションがあり、このようなスペルミスに加えて、人々は必ずしも正しい URL を知っているわけではありません。たとえば、サウスウエスト航空は southwest.com ですが、「swair.com」を検索しようとすると、その会社の Web ページが表示されます。同時に、通常「Yahoo ウェブサイト/メール」などの URL を目にする場合、正しい URL は「mail.yahoo.com」です。 たとえユーザーの真の検索意図がわかったとしても、悪意のある URL やスパマーが別の課題をもたらします。彼らは、coolmathgames.com (実際は coolmath-games.com) のようなトップレベルドメイン名を持つ URL を探します。 これが私たちの欠点であり、私たちは主に次の 3 つの領域でこのタイプの誤ったクエリ方法に対処しています。 まず、URL を正しく識別することでブロックすることができ、URL を識別することで searscardcom.com のようなスパム的な結果が含まれるなどの問題を回避できます。 次に、シミュレーションによるユーザー エラー テストを実施し、数十億のオリジナル モデルを通じて、よくある URL のスペルミスを解決します。 3 番目に、ユーザーが最終的に「southwest.com」のようなサイトを予約する原因となる「swair.com」のようなサイトを分析して探します。 機械学習モデルに適したもう 1 つの例は、「facebooklogin.com」のようなクエリが「facebooklogin.net」と同等であることです。これは非常に一般的なドメイン サフィックスのタイプミスです。また、「bed bath and beyond.com」をbedbathandbeyond.comと入力します。当社のモデルはこれらの変更に適応し、積極的に検索結果を修正します。次の例は Facebook ユーザーの場合です。 不要なトラッキングリンクを削除する 検索エンジンの重要な機能の 1 つは、クエリ実行のスペル チェックとクエリ拡張コンポーネントです。スペル チェックにより、表示される何百もの誤ったクエリと検索フレーズが修正されます (下のクエリ ボックスは、ユーザーのクエリが変更されたことを示しています)。この再構築を「再構築」と呼びます。たとえば、「成功した英雄的行為」と入力した場合、「引用符を含む成功した英雄的行為」と表示されますが、「成功した英雄と行為」のみが表示され、意図に関するすべての情報がフレーム化される可能性があります。 これまで、リンク トラッキングの一環として同義語を使用してきましたが、これによりトピックから外れた検索結果が表示されることが多く、同義語のトラッキングが冗長な機能となっていました。そのため、ユーザーにとってより適切な一致が得られるよう、「用語」の定義を継続的に拡張しています。 そのため、この機能は削除しました。付加価値は大きくありません。Bing が同義語を変更すると、追跡リンクでより価値のある情報を追加できなくなる可能性があるため、検索結果の色を黒に変更しました。弊社では、ユーザーが指定した検索用語に対して、より優れたクエリを提供できるよう引き続き取り組んでまいります。 関連検索を改善する 関連検索は、誰にとっても馴染み深いものです。ユーザーが最初に検索したとき、検索結果の左側に関連検索が表示されないようにしていました。今後は、右側に調整します。たとえば、「Brad Pitt」を検索します。 (注: Bing の中国語版は変更されていません。Baidu と Google は最下位にあります。) 時々、検索結果でトピックに関係のないコンテンツを検索することがあります。たとえば、「AMD」は関連性モデルを改善することで、ユーザーに予期しない検索結果を提供します。 また、関連検索の用語の書式設定(「KSN WeatherLab」の「KSN Weather Lab」など)を超えた改善や、セーフサーチでのアダルトコンテンツの回避など、他の部分でも改善を行いました。 結論は: 検索エンジンの利点は、常に人間に依存し、人間には常にさまざまな欠陥があることです。私たちが行うことは、欠陥率と検索率を減らし、人々がより少ない検索でより多くのことができるようにすることです。 著者: ウィリアム・ラムゼイ博士—— Bing コア検索研究開発部門の主任開発マネージャー
|
>>: 企業ウェブサイトの SEO 受注時に、うるさい顧客に対処する方法
複数の Alipay コンピューター ルームの光ケーブルが同時に引き抜かれ、サーバーの 40% が突...
無制限トラフィックの「rectified.net」や安価な1Gbps無制限トラフィックの「cloud...
このタイトルは主流の価値観と矛盾しているようです。諺にあるように、10 の技は 3 つの馴染みのある...
企業におけるデータ保護について語るとき、人々はよく文書を思い浮かべるかもしれません。しかし、文書の内...
以前、Hostcatでv.psのオランダvpsの評価記事「V.PSはどうですか?オランダAS9929...
北京時間2月9日、eBay CEOのジョン・ドナホー氏は、かつて栄華を誇ったeBayを驚異的な復活へ...
ftpit から最新のプロモーション メールを受け取りました。このメールには、西海岸のフリーモントと...
今日、ネットで情報を検索していたところ、ウェディングフォトのウェブサイトを見たのですが、そのランキン...
[51CTO.comからのオリジナル記事] Tencent Cloudは開発者を非常に重視しています...
インターネットでお金を稼ぎたい個人ウェブマスターとして、私が毎日最も考えているのは、自分のウェブサイ...
OVHが通常のVPSとVPSクラウドを正式に開始しました。価格は大きく異なりますが、共通点は10Tト...
ブランドに関しては、専門家が 1,000 人いれば 1,000 通りの定義があります。成熟した心は異...
序文:草の根ウェブマスターとして、A5 のようなウェブマスター プラットフォームで自分の経験を共有す...
パブリック クラウドの導入は拡大し続けていますが、プライベート クラウド プラットフォームは消滅した...
インターネットの急速な発展と電子商取引産業の台頭により、ますます多くの人々がSEOに触れ、理解し始め...