[51CTO.comより引用] 2017年12月1日~2日、51CTO主催のWOTDグローバルソフトウェア開発技術サミットが深セン中州マリオットホテルで開催されます。このサミットのテーマはソフトウェア開発であり、数十名の専門家ゲストが多くの素晴らしい技術コンテンツを共有します。当時、聯家のシニアテクニカルディレクターであるFeng Yang氏は、ディープラーニングとインテリジェントアプリケーション開発サブ会場で基調講演「データと機械学習に基づくブローカーの評価と管理」をゲストと共有し、機械学習アルゴリズムの力を利用して不動産ブローカー評価システム、ブローカーレベルのステータスモデル、行動モデルなどのコンテンツを構築する方法を詳しく説明します。 51CTO は、皆様がこのカンファレンスにご参加いただき、テクノロジーがもたらす喜びを私たちと共有していただくことを心より願っております。 51CTO記者は、同カンファレンスで講演するFeng Yang氏に独占インタビューを行った。ブローカーの評価と管理におけるディープラーニングとインテリジェント アプリケーションの応用について、彼がどのように考えているかを少し覗いて見てみましょう。 不動産業界の特性上、より効率的な人事管理方法が必要となる 不動産業界にとって、仲介業者は会社の中核となる「資産」です。ブローカーの質は、サービスレベルと会社の業績に直接影響します。ブローカーの経営効率は彼らの中核的な競争力となっている。従来の多段階の手動管理方法には、客観性と包括性の両面で効率性の問題があります。聯家はすでに32都市に約15万人の仲介業者を抱え、中古住宅、新築住宅、賃貸、旅行などを扱っており、事業拡大に伴いその数も増え続けている。したがって、ブローカー管理のレベルと効率性に対する要件は非常に高くなります。 データと機械学習に基づく仲介業者管理システムの構築の出発点は、ビッグデータとアルゴリズムの機能を活用して管理者の判断と意思決定を支援し、それによって不動産仲介業者の管理レベルと効率を向上させることです。経営の実行に直接関与するのではなく、分析結果を出力して経営者の経営を支援する補助システムです。 ブローカー評価管理システムの基本構造を下図に示します。下から上に、データ収集、オフライン分析、予測計算、結果の適用が含まれます。 データ収集の目的は、ブローカーに関する基本情報、職務レベル、業績、勤務態度など、あらゆるデータを可能な限り包括的に収集し、ブローカーを特徴づける特性データに整理・加工することです。オフライン分析は主にブローカーの特性データを分析し、ブローカーの個人のポートレートとグループ特性を記述し、異なるブローカーグループ間の典型的な違いを見つけ、手動管理経験を導入して異なるグループにラベルを付けます。予測計算とは、さまざまな判断や予測のタスクに対して機械学習の手法を使用してモデルを構築し、ブローカーごとに予測を行うことです。予測結果は、対応する管理システムへの入力として出力され、ブローカーの能力開発、違反の検証と処理、人事管理、スキルトレーニングなどに役立ちます。 データと機械学習に基づくブローカー評価管理システムの利点を3つの側面から浮き彫りにする 従来の多段階の手動管理方法と比較して、データと機械学習に基づくブローカー評価および管理システムの利点は、主に次の 3 つの側面に反映されています。 1. ブローカーの描写はより包括的かつ客観的である 多段階の手動管理方式は、管理者のレベル、感情、心理状態などの要因に大きく影響されます。管理者のレベルによって能力レベルが異なり、標準の実装やステータス評価にも比較的大きな差があります。同じマネージャーであっても、異なる感情や異なる時期における心理状態は、判断や意思決定にも影響を及ぼします。 上記の欠点は、データとアルゴリズムによって補うことができます。データとアルゴリズムによって描写されるブローカーの基準と能力は客観的なデータから得られるものであり、感情、時間、ステータスの影響を受けません。機械学習アルゴリズムはデータを包括的に収集し、分析することができます。 2. データから出発して、潜在的な要因を時間内に発見できる 多段階の手動管理は、上級管理者の経験によって制限され、いくつかの潜在的な要因が無視される可能性が高く、これは特に新しい問題に直面したときに顕著になります。詐欺防止を例に挙げてみましょう。住宅情報の公開方法が変わり、仲介業者が照会しやすくなった場合、どのオンライン行動特性が仲介業者による住宅情報の漏洩などの違法行為を反映しているか?手動管理では、調査と要約にかなりの時間が必要です。このゲームプロセスでは、管理者が手作業で情報を取得する速度が、行動特性の変化に追いつけないことがよくあります。データと機械学習の手法は、データから開始して潜在的な異常要因を迅速に検出し、ブローカーの行動管理に追加の保護層を提供します。 3. データ処理効率を大幅に向上 機械学習のもう一つの利点は、データ処理の効率性です。ブローカーの日々の業務活動では大量のデータが生成されます。このデータ生成は、事業の拡大や人員の増加に伴って非線形に増加します。この状況に対処するには、管理者のトレーニングコストによって管理効率を向上させる必要性が決定されます。データと機械学習を組み合わせることで、人件費を大幅に節約し、機械が反復的、定期的な要約、明確な判断の標準作業を完了できるようにすることで、管理者の管理効率を向上させることができます。 データと機械学習に基づくブローカー評価・管理システムの実装 ブローカー管理の観点から見ると、データと機械学習の方法は主に 2 つの重要な問題を解決します。1 つ目は、ブローカーを特徴付け、グループの観点からブローカー モデルを確立することです。 2 つ目は、ブローカーの予測を行い、一定の制約の下でブローカーの潜在的な能力、成長経路、コンプライアンス リスクを予測することです。前者は事後的な問題であり、ブローカーのあらゆる側面からの「定量化された」特性表現に相当します。データは定量化の基礎であり、データ マイニング手法は最大のパターンと最も重要な特徴を発見するために使用されます。後者は事前問題であり、機械学習手法を使用してブローカーの特性に基づいて予測モデルと判別モデルをトレーニングし、対応するタスクをターゲットにして新しいサンプルや発生していない事柄を予測します。その中でも、データは基礎であり、機械学習はデータ処理と目標達成の手法です。 データと機械学習に基づくブローカー評価・管理システムの基本原理を下図に示します。 ブローカーの特性には、静的属性特性、ステータス特性、動的動作特性などが含まれます。これらの特性は、人事、財務、契約、取引、リンク操作終了などの一連のビジネス データから得られます。ビジネス データを抽出して処理することで、各ブローカーを構造的に記述し、ブローカーの特性データを作成することができます。特徴データの構築は、機械学習を使用してブローカー管理を支援するための基礎となります。 一方、個々のブローカーのデータで構成される特性データセットについては、教師なし学習手法を使用して個々のセットをグループに分割し、統計的手法を使用して差異分析を行います。人材管理の経験と組み合わせて、重要な特性を持つブローカー能力モデルを構築し、グループポートレートと能力マッピングを形成します。 一方、教師あり学習は、ステータス判定(個々のブローカーの現在のステータスのレベルを判定し、それが実際のレベルよりも良いか、同じか、悪いかを評価する)、ブローカー成長パス計画(個々のブローカーの成長に適した次の目標と、その目標を達成するために能力を向上させる必要がある領域を予測する)、ブローカーリスク予測(辞職や違反などのリスクを予測する)などの側面から、管理者の意思決定やブローカー管理を支援するために使用されます。 アプリケーションの問題を見つけて解決する ブローカー能力モデルの構築、ブローカーの辞任リスク予測、違反判定、リスク予測は、データと機械学習に基づくブローカー評価および管理システムの現在の主な応用シナリオです。そのうち、ブローカー能力モデル構築には、ブローカーのサービス能力、専門スキル、成長可能性、革新能力、チーム貢献能力などの5つの側面が含まれており、10万人のブローカーと20以上の都市をカバーしています。ブローカー離職リスク予測により離職リスクがあると判断されたブローカーの半数以上は1ヶ月以内に離職し(正解率>50%)、5分の1のブローカーは離職前に適時に検出できます(リコール率>20%)。違反判定とリスク予測により、ブローカーの虚偽上場識別(モデル識別 + オフライン検証)の効率が手動戦略(戦略ルール識別 + オフライン検証)と比較して 4 倍向上しました。毎月数百件の上場漏洩事件を自動発見(その後、モデル識別+手動検証)し、事前リスク警告の研究開発も現在進行中です。 申請プロセス中に最もよく発生する問題は、結果の解釈可能性と実際の効果の検証という 2 つです。 1. システムによって出力される結果は、違反判定など、結果の理由を説明する必要がある問題において、ブローカーの管理における人材の支援に適しています。しかし、機械学習自体は相関計算であり、アルゴリズムモデルの複雑さが増すにつれて、その結果の解釈可能性は低下します。現在の状況では、Lianjia はデータリンクバックトラッキング方式を採用しています。リスクの高い結果については、計算内のデータリンクを遡り、リンク内の疑わしい点をチェックして判断する手動の方法を導入します。 2. 効果検証では、オフラインでテストセットのモデル効果を簡単に検証でき、その結果はブローカー管理の支援に使用されます。予測された結果に基づいてマネージャーが介入すると、実際の結果に影響が出る可能性があります(たとえば、退職の危機にあるブローカーは、マネージャーの介入により、退職の考えを断念する可能性があります)。現在、連佳の対応は、正式ローンチ前に経営介入を導入せず、結果を評価し、正式ローンチ後に大規模な時間スケールで他の関連指標の変化を比較すること(月単位の時間スケールでの売上高の前年比および前月比の比較など)、および異なる都市や地域間の比較を行うことです。 データと機械学習に基づく方法は良いが、成長するには肥沃な土壌も必要だ 馮楊先生は、データと機械学習に基づく方法を使用するには、業界におけるデータ構築の程度と、業界におけるさまざまなビジネスリンクの標準化の程度という2つの主な条件があると紹介しました。結局のところ、これらはすべてデータに対する要件です。前者はデータ量に対する要件であり、データが一定の規模とビジネスの範囲に達することが必要です。後者は、特徴を効果的に定量化できるようにするためのデータ品質の要件です。 Lianjia がデータと機械学習の手法を使用できるのは、一方では、長年にわたる情報化により、オフラインの操作、動作、およびデータのほとんどがオンライン化されたためです。オンライン情報システムを使用して、ブローカーの基本情報、行動データ、パフォーマンス状況、作業プロセスなどを集めて管理し、ブローカーに関するあらゆるデータを比較的包括的に集めます。一方、不動産分野は長年の発展と変革を経ており、その各分野において対応する業界規範と基本的な評価基準が形成されてきました。 インターネットを活用して情報化のプロセスを開始する 最後に、Feng Yang氏がLianjiaの情報化プロセスについて簡単に紹介しました。聯家は2010年に情報化と標準化の実施を開始した。初期段階では、主に第三者企業との戦略的協力を通じて不動産取引の標準化を行い、オフライン情報を収集してデジタル管理していた。 Lianjia.comは2014年に正式に設立され、インターネットを通じてブローカーの運営プロセス、資産と顧客ソースの管理、情報サービスなどを完全にデジタル化し、オンライン情報アクセス、オフラインブローカーサービス、さまざまなビジネスリンクでのデータ収集と回復の完全なループを確立しました。 2015年末から、聯家は不動産ビッグデータ化のプロセスを加速させ、住宅情報から始めて、オンラインでの入力、収集、検証、リリースを組み合わせて100%リアルな住宅データベースを確立し、さまざまな業務システムに散在するデータを徐々に収集、再編成、管理し、「住宅(ハウジング)-ゲスト(クライアント)-人(エージェント)」を中核とするビッグデータネットワークを構築してきました。ネットワーク内の情報フローの効率を向上します。 現在、「Lianjia.com-データ戦略部」は、ビッグデータ、検索プラットフォーム、NLP、戦略アルゴリズムなどのチームをカバーしています。連家不動産ビッグデータの構築を担当しています。同時に、データマイニング、機械学習などの手段を組み合わせて、データ製品、戦略製品、データと能力の出力の形で不動産取引の買い手、売り手、ブローカーにサービスを提供すると同時に、ビッグデータシステムに依存して不動産取引業界の標準化プロセスを促進します。 【講師プロフィール】
Feng Yang、北京理工大学情報工学博士、Lianjia.com データ戦略部門シニアディレクター。彼はSina Weibo、Tencent、Sogouなどのインターネット企業で推薦技術の専門家として勤務し、推薦アルゴリズムの研究や推薦システムの開発に従事していました。研究分野には、データマイニング、機械学習、推奨システムなどが含まれます。ソーシャルメディアデータマイニング、ソーシャルネットワークユーザー関係モデルの構築、Weibo推奨システムとシステム構築、Weiboビデオセマンティック分析システムなどを主宰し、実装してきました。2017年にLianjia.comに入社し、Lianjia.comのデータマイニング、ビッグデータ製品、戦略アルゴリズムなどを担当しています。 クーポンコード [2017WOTDSZ] を使用して、WOTD グローバル ソフトウェア開発テクノロジー サミットにご参加ください。 72時間限定で20%オフ!詳細については、www.wot..comをご覧ください。 [51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください] |
>>: ビッグデータが急成長し、我が国のクラウドコンピューティングは「黄金の窓」の時代を迎えている
edgenat は、香港 CN2、韓国 CN2 (ネイティブ IP)、米国 Unicom AS483...
今では、IT プロフェッショナルは、企業のビジネス開発に対するクラウド移行のメリットを明確に認識して...
最近、多くのネットユーザーが、いつも利用しているダウンロード Web サイト VeryCD のすべて...
serverwala は、インドで VPS、専用サーバー、GPU サーバー、機器ホスティング、その他...
[51CTO.comからのオリジナル記事] Huawei CloudとCNCFの関係は2015年にま...
編纂者:Qianshan制作 | 51CTO テクノロジースタック (WeChat ID: blog...
企業が特定のプラットフォームの専用ストレージ、コンピューティング、データベースなどの機能を使用するこ...
従来のオンプレミス データ センターはまだ存在していますが、かつてそこで主流だったワークフローは急速...
「背が高く、金持ちで、ハンサム」なサイト - 高品質の機能詳細、豊富なアプリケーション、ハンサムなイ...
呂梁は、涼しく快適な気候、安定した地質構造、豊富な電力供給など、明らかな立地上の優位性を備えており、...
racknerd のウェブサイトがリニューアルされた後、プロモーション用に 3 つの安価な VPS ...
柔軟性からフェイルオーバー保護まで、企業がマルチクラウド戦略を選択する理由は数多くあります。 IDC...
この機会に、ウェブマスターと SEO 仲間の皆さんに建国記念日のお祝いを申し上げます。王世凡氏は8月...
appleinsiderによると、米国特許商標庁は「電子機器のアクティブスクリーン保護」メカニズムと...
先日終了した天猫ダブル11では、取引額2,684億元、ピーク時の注文件数54万4,000件/秒という...