Bing Core Search R&D による検索品質に関する洞察

Bing Core Search R&D による検索品質に関する洞察

序文: これは Bing のコア検索研究開発部門のマネージャーによる記事です。この記事では、Bing の一連の機能改善について説明しています。これは検索機能の改善に関する一般的な紹介にすぎませんが、この記事を読んだ後、検索エンジンは、人々が検索するときに犯す間違い、ユーザーの意図を正しく理解する方法、語彙を使用してより正確なコンテンツを提供することに多くのエネルギーを注いでいることがわかります。そのため、Lu Songsong 氏は、Bing、Google、Baidu のいずれであっても、同じことをするだろうと考えています。

Bing では、可能な限り最高の検索結果を提供することに注力しています。Bing のコア検索およびランキング アルゴリズムは、データ マイニングの専門家チームによって継続的に改善されていますが、実際には、歴史的に欠陥が常に存在しています。これは、検索に頼りすぎるとユーザーが犯す間違いが原因の一部です。この記事では、同僚で Bing の研究開発マネージャーである Bill Ramsey が、URL クエリ、フォロー リンク、関連検索の 3 つの領域における欠陥の発生率と重大性について説明します。

一般的な URL クエリ エラー

これは検索の欠陥の主な原因の 1 つであり、「facebook.com」や「yahoo website/mail」などの URL クエリと呼ばれるものに関係しており、一見すると単純な問題と思われるかもしれません。結局のところ、検索エンジン (Bing) には数十億の URL が含まれているため、一致する Web サイトを見つけるのは難しくありません。しかし、実際には、このタイプのクエリは非常に複雑です。なぜなら、私たちは皆、数え切れないほどのスペルやバリエーションを使用しているからです。

たとえば、「facebook.com」には「facebookc.om」、「facbook.com」、「ww.faceboo.omc」など何千もの異なるバリエーションがあり、このようなスペルミスに加えて、人々は必ずしも正しい URL を知っているわけではありません。たとえば、サウスウエスト航空は southwest.com ですが、「swair.com」を検索しようとすると、その会社の Web ページが表示されます。同時に、通常「Yahoo ウェブサイト/メール」などの URL を目にする場合、正しい URL は「mail.yahoo.com」です。

たとえユーザーの真の検索意図がわかったとしても、悪意のある URL やスパマーが別の課題をもたらします。彼らは、coolmathgames.com (実際は coolmath-games.com) のようなトップレベルドメイン名を持つ URL を探します。

これが私たちの欠点であり、私たちは主に次の 3 つの領域でこのタイプの誤ったクエリ方法に対処しています

まず、URL を正しく識別することでブロックすることができ、URL を識別することで searscardcom.com のようなスパム的な結果が含まれるなどの問題を回避できます。

次に、シミュレーションによるユーザー エラー テストを実施し、数十億のオリジナル モデルを通じて、よくある URL のスペルミスを解決します。

3 番目に、ユーザーが最終的に「southwest.com」のようなサイトを予約する原因となる「swair.com」のようなサイトを分析して探します。

機械学習モデルに適したもう 1 つの例は、「facebooklogin.com」のようなクエリが「facebooklogin.net」と同等であることです。これは非常に一般的なドメイン サフィックスのタイプミスです。また、「bed bath and beyond.com」をbedbathandbeyond.comと入力します。当社のモデルはこれらの変更に適応し、積極的に検索結果を修正します。次の例は Facebook ユーザーの場合です。

不要なトラッキングリンクを削除する

検索エンジンの重要な機能の 1 つは、クエリ実行のスペル チェックとクエリ拡張コンポーネントです。スペル チェックにより、表示される何百もの誤ったクエリと検索フレーズが修正されます (下のクエリ ボックスは、ユーザーのクエリが変更されたことを示しています)。この再構築を「再構築」と呼びます。たとえば、「成功した英雄的行為」と入力した場合、「引用符を含む成功した英雄的行為」と表示されますが、「成功した英雄と行為」のみが表示され、意図に関するすべての情報がフレーム化される可能性があります。

これまで、リンク トラッキングの一環として同義語を使用してきましたが、これによりトピックから外れた検索結果が表示されることが多く、同義語のトラッキングが冗長な機能となっていました。そのため、ユーザーにとってより適切な一致が得られるよう、「用語」の定義を継続的に拡張しています。

そのため、この機能は削除しました。付加価値は大きくありません。Bing が同義語を変更すると、追跡リンクでより価値のある情報を追加できなくなる可能性があるため、検索結果の色を黒に変更しました。弊社では、ユーザーが指定した検索用語に対して、より優れたクエリを提供できるよう引き続き取り組んでまいります。

関連検索を改善する

関連検索は、誰にとっても馴染み深いものです。ユーザーが最初に検索したとき、検索結果の左側に関連検索が表示されないようにしていました。今後は、右側に調整します。たとえば、「Brad Pitt」を検索します。

(注: Bing の中国語版は変更されていません。Baidu と Google は最下位にあります。)

時々、検索結果でトピックに関係のないコンテンツを検索することがあります。たとえば、「AMD」は関連性モデルを改善することで、ユーザーに予期しない検索結果を提供します。

また、関連検索の用語の書式設定(「KSN WeatherLab」の「KSN Weather Lab」など)を超えた改善や、セーフサーチでのアダルトコンテンツの回避など、他の部分でも改善を行いました。

結論は:

検索エンジンの利点は、常に人間に依存し、人間には常にさまざまな欠陥があることです。私たちが行うことは、欠陥率と検索率を減らし、人々がより少ない検索でより多くのことができるようにすることです。

著者: ウィリアム・ラムゼイ博士—— Bing コア検索研究開発部門の主任開発マネージャー

<<:  友情の連鎖構築の全プロセスの簡単な分析

>>:  企業ウェブサイトの SEO 受注時に、うるさい顧客に対処する方法

推薦する

リッチスニペットで検索結果のクリック率を向上させる

リッチ スニペットを使用すると、検索エンジンは検索結果をユーザーに表示する際に、デフォルトのスタイル...

事実と根拠を提示してフォーラム署名の有用性を分析する

最近、Baiduの外部リンク取り締まりがますます厳しくなり、Kサイトが流行っています。SEO業界は本...

2020 TECHO PARK 開発者会議セキュリティフォーラムで最先端のセキュリティ技術を探りましょう。

デジタル経済の波は止められない勢いで世界を席巻しています。クラウドコンピューティング、5G、AI、ビ...

外部リンクを永続させたい場合、その方法は非常に重要です

ウェブサイトの最適化は、外部リンクの構築と切り離せないものです。Baidu の新しいアルゴリズムでは...

ウェブサイトコンテンツの最適化: キーワード分析ツール

コンテンツの最適化は、今日でも SEO 活動の最も重要な焦点です。ウェブサイトやブログにコンテンツを...

ホームページのランキングに含まれない6つの重要な要素

360 ブラウザとの競争により、Baidu 検索エンジンも市場競争のプレッシャーを感じています。Ba...

アマゾン第1四半期財務報告:クラウドコンピューティング事業の収益は135億ドル

海外メディアの報道によると、アマゾンが発表した第1四半期の財務報告によると、第1四半期の純売上高は1...

ショック! JD Cloud と Kingsoft Cloud が統合されましたか? ......

たった今、ネットユーザーがニュースを報じました: JD Cloud と Kingsoft Cloud...

Pinduoduoは崩壊するのか?

第2四半期の財務報告が発表された日、ピンドゥオドゥオの株価は13%以上下落し、疑念やパニックさえも高...

Apache Kafka クイック スタート ガイド

導入Kafka はパブリッシュ/サブスクライブ型のメッセージング システムです。もともと Linke...

#黑5# zji: 香港サーバー(物理マシン)、10M帯域幅、Ali cn2+bgp+40G高防御、最低750元

ブラックフライデーセール期間中、Zjiは香港アリババクラウドネットワークの専用サーバーの直接注文に3...

ブランドプロモーション:低コストのマーケティングを行うには?

「低コストマーケティング」というと、多くの人はコストのかからないマーケティングだと理解するでしょう。...

Kafkaのファイル保存メカニズムについて

[[282846]]カフカとは何かKafka はもともと Linkedin によって開発されました...

edgenat: 春節特別オファー、最大 60% オフ/30 元から、香港 BGP/韓国 CN2/韓国 SK (ネイティブ IP)、ハイエンドで高帯域幅の専用サーバー

旧正月を前に、edgenat は春節プロモーションの波をお届けします。すべての VPS クラウド サ...