タオバオのカテゴリー属性システムについて簡単に説明:商品検索の背後にある論理アーキテクチャ

タオバオのカテゴリー属性システムについて簡単に説明:商品検索の背後にある論理アーキテクチャ

【ポイント】Taobao には数百万の加盟店と 10 億以上の商品があります。ユーザーが希望する商品を正確に見つけられるようにするにはどうすればよいでしょうか。その背後には強力な技術サポートがあります。

タオバオには現在、10億を超えるオンライン製品があります。ユーザーが欲しい製品を正確に見つけられるようにするにはどうすればよいでしょうか。長年の探求を経て、タオバオはついに完全なカテゴリ属性システムを確立することでこの問題を解決しました。今日は、タオバオのカテゴリ属性システムについてお話ししましょう。

歴史と建築について少し

2003 年に Taobao が初めて立ち上げられたとき、商品は非常に少なく、カテゴリもありませんでした。 その後、商品の数が数百に達したため、現在の第 1 レベルの産業カテゴリに似た単一のレベルで商品を分類し始めました。

製品が数万点になると、単一レベルの分類では需要を満たせなくなるため、カテゴリツリーである多段階の分類が始まります。属性は 2006 年に導入されました。販売者は属性テンプレートに従って属性を入力し、ユーザーは属性に従って商品をフィルタリングできます。

2008 年に、フロントエンド カテゴリとバックエンド カテゴリが分離されました。ユーザーはフロントエンド カテゴリに基づいて製品をフィルタリングし、販売者はバックエンド カテゴリに製品を追加しました。フロントエンド カテゴリ ツリーとバックエンド カテゴリ ツリーの間にマッピングが確立されました。

現在の Taobao カテゴリ属性システムは、主にバックエンド カテゴリ ツリー、フロントエンド カテゴリ ツリー、リーフ カテゴリに搭載された製品属性テンプレート、およびフロントエンド カテゴリとバックエンド カテゴリ間のマッピング関係を管理するカテゴリ管理プラットフォームで構成されています。全体的なアーキテクチャは次のとおりです。

図からわかるように、タオバオのカテゴリ属性システムは非常に基本的なデータサービスです。商品リリースページでは、販売者はバックエンドカテゴリを選択して商品情報をアップロードします。詳細ページには、商品が属するフロントエンドカテゴリがパンくずリスト形式でユーザーに表示されます。検索結果ページでは、ユーザーはフロントエンドカテゴリに基づいて商品をフィルタリングできます。運用担当者は、管理バックエンドを使用して、フロントエンド カテゴリとバックエンド カテゴリ間のマッピング関係と、バックエンド カテゴリの属性テンプレートを管理できます。

バックステージカテゴリー

バックエンド カテゴリは販売者向けであり、主に製品の分類と属性管理に使用されます。販売者が商品をアップロードすると、以下に示すように背景カテゴリが表示されます。

背景カテゴリには次の特性があります。

背景カテゴリ ツリーで最も重要なカテゴリはリーフ カテゴリです。リーフ カテゴリは、カテゴリ ツリー内でこれ以上下に分割できないカテゴリです。すべての製品は、背景リーフ カテゴリにマウントする必要があります。

リーフ カテゴリには属性テンプレートがマウントされています。販売者が商品を公開する際、カテゴリを選択し、属性テンプレートに従って必要な商品属性情報を入力してから、商品を正常にアップロードできます。

バックエンド カテゴリは比較的安定しており、任意に削除することはできず、リーフ カテゴリを繰り返すことはできません。

フロントデスク部門

フロントエンドの分類はユーザー指向であり、ユーザーが製品をフィルタリングしたり検索したりすることが容易になります。ほとんどの場合、ユーザーに表示されるカテゴリはフロントエンドのカテゴリです。次の図は、Taobao 検索結果ページの Taobao フロントエンド カテゴリ ツリーです。

フロントエンド カテゴリには次の特性があります。

ユーザーが購入するときに表示されるカテゴリは、フロントエンド カテゴリです。

フロントエンド カテゴリは、バックエンド マッピングを通じて間接的に製品に関連付けられます。

フロントエンド カテゴリは、バックエンド リーフ カテゴリ + 属性で構成されます。フロントエンド カテゴリには複数のバックエンド カテゴリを含めることができ、バックエンド カテゴリを複数のフロントエンド カテゴリにマップすることもできます。

フロントエンド カテゴリは、属性テンプレートを直接マウントしません。フロントエンド カテゴリに対応する属性は、バックエンド リーフ カテゴリのパブリック属性から取得されます。

フロントエンドのカテゴリは非常に柔軟性があり、重複したり削除したりできます。

フロントエンドとバックエンドのカテゴリを分けるのはなぜですか?

Taobao のカテゴリ属性システムを紹介した後、フロントエンド カテゴリとバックエンド カテゴリを分離する必要がある理由について疑問に思うかもしれません。カテゴリ システムを 1 つ使用するだけで十分ではないでしょうか。ここでその理由を説明します。2008 年までに、Taobao の製品数は日々増加し、カテゴリ階層はますます深くなり、購入者が希望する製品を見つけることがますます困難になりました。 Taobao の店員はカテゴリ属性を絶えず調整し始め、カテゴリツリーを浅くして、購入者が商品を見つけやすくしました。カテゴリ システムが 1 セットしかない場合、販売員が調整を行うたびに、販売者も調整を行う必要があります。一度だけの変更であれば、売り手はそれをほとんど受け入れることができませんが、これは周期的なものです。例えば、夏服のカテゴリーでは、ワンピースやシャツなどの夏服があり、冬にはレギンスやダウンジャケットなどの冬服になることがあります。セラー側もこれらの調整が合理的であることはわかっていますが、年間を通じてこのような調整を行うということは、年間を通じてカテゴリーを編集していることになり、一日中カテゴリーを変更するために数人の人を雇わなければならない場合もあり、目に見えない形でセラーの運営コストが増加します。

2008年、タオバオの製品マネージャーは、オフライン小売大手のウォルマートに触発され、ウォルマートの倉庫のカテゴリー区分と棚エリアのカテゴリー区分が別々であることを発見しました。倉庫のカテゴリー区分は比較的安定しており、ほとんど変更されませんでしたが、棚エリアのカテゴリー区分は活動や季節に応じて頻繁に調整されていました。同様に、Taobao は元のカテゴリ システムをバックエンド分類とフロントエンド分類に分割することもできます。バックエンド分類は販売者向けであり、製品や属性テンプレートをマウントするために使用されます。比較的安定しており、変更されることはほとんどありません。フロントエンド分類はユーザー向けであり、主にユーザーが製品を見つけるのに便利です。非常に柔軟性が高く、頻繁に調整できます。バックエンド カテゴリとフォアグラウンド カテゴリはマッピングを通じてリンクされます。 1 つのバックエンド カテゴリを複数のフォアグラウンド カテゴリにマッピングすることができ、1 つのフォアグラウンド カテゴリに複数のバックエンド カテゴリを含めることもできます。

技術的な観点から言えば、フロントエンドカテゴリは、バックエンドカテゴリに基づいて確立された仮想カテゴリです。

検索におけるカテゴリ属性システムの応用

まず、カテゴリ属性システムが検索精度の向上にどのように役立つかを見てみましょう。次の図は、ユーザーのクエリから製品検索結果までのプロセス全体を示しています。

ユーザーが「iPhone」というクエリを入力すると、Taobao のカテゴリ属性システムは、このクエリに最も関連性の高いフォアグラウンド カテゴリは携帯電話であると予測します。次に、フォアグラウンド カテゴリはマッピングを通じてバックグラウンド カテゴリの携帯電話を見つけ、最終的にこのカテゴリの下にある製品「iPhone 5s Gold」を見つけます。

カテゴリ属性システムでは、ユーザーが iPhone を検索すると、Taobao は携帯電話カテゴリ内の製品のみを検索するため、携帯電話ケースなどのアクセサリは表示されません。

カテゴリ属性システムを使用すると、ユーザーは検索結果ページでカテゴリと属性によって製品を直接フィルタリングし、必要な製品をより効率的に見つけることができます。タオバオ検索は、クエリ検索後のユーザーのカテゴリ属性スクリーニング行動を記録することで、各クエリのカテゴリと属性の意図を正確に予測できます。ユーザーが再度検索すると、クエリのカテゴリ属性の意図とクエリテキストの関連性に基づいて商品のカテゴリと属性の関連性を計算でき、クエリを含み、ユーザーのカテゴリと属性の意図に最も関連性の高い商品が最初にユーザーに表示されます。これは、Baidu などの一般的な検索エンジンではカテゴリ属性システムがないため実行できないことです。

カテゴリ属性システムを使用すると、検索アルゴリズムの垂直最適化も実行できます。つまり、各サブカテゴリでは、異なる販売者の重みとブランドの重みを使用でき、異なる並べ替え式も使用できます。例えば、ユーザーが携帯電話を選ぶとき、さまざまなパラメータを考慮し、記事をより多くレビューします。このとき、対応するソートの重み付け要素を強化することができます。服を選ぶとき、メイン画像の美しさは非常に重要であり、ソート要素におけるメイン画像の品質の重みを高める必要があります。 カテゴリ属性システムを使用すると、カテゴリと属性に基づいてパーソナライズされた検索を行うこともできます。検索エンジンは、ユーザーのカテゴリ属性に基づいてログをフィルタリングし、性別、希望する価格帯、好みのブランド、好みのカテゴリなどのユーザーの特性を明らかにして、ユーザー向けにパーソナライズされた表示を行うことができます。

カテゴリ属性システムはどこにでもある

カテゴリ属性システムは、電子商取引以外にも、情報を素早く見つけるのに役立つさまざまな分野で見られます。たとえば、教育業界におけるコース分類、医療業界における疾病や病院の分類などです。ユーザーが探している情報をエンティティと見なす場合、エンティティを分類してすばやく見つけて検索できるようにするのは非常に一般的な方法です。この観点から見ると、Google の Knowledge Graph は、電子商取引 Web サイトの製品カテゴリ属性システムを世界中のあらゆるものに拡張したものと見ることができます。統一されたカテゴリ属性ネットワークを使用して、すべてのエンティティを網羅しようとしています。これは、一般的な検索エンジンのカテゴリ属性システムである可能性があります。

タイトル画像はHybris Softwareより

著者: @葛灿辉-検索データマイニング/検索プロダクトマネージャー

Baidu で働きながら、思慮深い検索プロダクト マネージャーになりたいと考えています。

出典: Geek Park、転載の際は著者と元のリンクを明記してください。

元の URL: http://www.geekpark.net/read/view/205894


元のタイトル: タオバオのカテゴリ属性システムに関する簡単な説明: 商品検索の背後にある論理アーキテクチャ

キーワード:

<<:  Zhaopin.com、求人サイトJobs DBの中国事業を1572万ドルで買収

>>:  ソソの死:あなたの手は手に入らない

推薦する

平安科技区海英が51CTO「2018年中国IT産業優秀人物賞」を受賞

最近、由51CTO主上の《中国上海》ITインプレッション Normal 0 7.8 磅 0 2 fa...

eBay、中国の金融決済ライセンスを取得した初の海外企業に

イーベイは中国で金融決済ライセンスを取得する初の海外企業となるが、地元企業が支配する競争の激しい小売...

UCloud UDBテクノロジーの実践を探る

[51CTO.com オリジナル記事] 「6年間、UDBは常に多くのユーザーとともに成長してきました...

bergenhosting: $10/年、KVM 仮想 VPS/512 メモリ/ノボシビルスク/ロサンゼルス

Bergenhostingは新興企業で、VPSと専用サーバーを主な事業としています。Bergenho...

Rise with SAP の使用に適した企業はどのような企業ですか?

[[433172]]約1年前、SAPはRise with SAPという新製品を発表しました。当時、C...

完璧なページ依存関係

インターネット マーケティングは、さまざまな Web サイト間の接続を構成する多数のページで構成され...

ショップをロングテールキーワードとして使用してトラフィックを独占する

ホームページに主要キーワードを配置した後、獲得できる注文数が予想ほど多くないことがわかりました。これ...

Kubernetes コンテナ オーケストレーション: 高可用性コンテナ化デプロイメントの実現

現代のクラウドネイティブ アプリケーション開発では、コンテナ化テクノロジーは欠かせないツールとなって...

最適化手法の観点から見た新旧サイトの違いと類似点

今日読んだ記事によると、Baidu の低重量の表れの一つは、ウェブサイトのスナップショットの更新が遅...

モバイルソーシャル製品は、商業的な包囲の中でどのように独立を達成できるのでしょうか?

モバイルインターネットの強力な影響から生まれた製品チェーンは、これまで業界関係者に衝撃を与えてきまし...

奇妙な沼地: 医療 SEO に関する外部の視点

Baidu による医療 SEO の継続的な取り締まりにより、多くの医療 SEO 担当者は最近ますます...

vpsace-128M メモリ VZ 年払い 9 米ドル

以前、vpsace のプロモーションについて書きました (こちらを参照)。 全体的な状況: Inte...

Banwagonhost の香港 VPS 割引コード、香港 VPS、大容量帯域幅、格安香港 VPS

待望のBandwagonhost香港VPSがついにオンラインになりました。香港では1Gbpsの帯域幅...

高品質のウェブサイトを構築するにはどうすればいいでしょうか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス高品質なウェブサイトを構...

Hiformance: 専用サーバー/最低 49 ドル/E3-1230v2/32g/1T/13IPv4

Hiformance は、独立サーバー、ロサンゼルス データ センター、クアドラネット コンピュータ...