アリババクラウドの新たなAIのブレークスルー:AIレジ係が人間よりも速く正確に勤務

アリババクラウドの新たなAIのブレークスルー:AIレジ係が人間よりも速く正確に勤務

[[230167]]

「チョコレート5杯、バニララテ2杯、チョコレートとクリーム。」

「ミディアムサイズのキャラメルラテ2杯、1杯はホット、もう1杯はコールド。」

「忘れてください。チョコレートはいらないんです。」

「氷少なめのスモールモカをあと6杯、キャラメル入りが3杯、バニラ入りが3杯。」

「そして、冷たいラテのラージサイズ、氷なし、砂糖半分、スキムミルクを持ち帰ります。」

Yan Zhijie は、1 秒あたり最大 5 語の速度で機械に命令を出しました。マシンは会話に正確に反応したが、待機していた経験豊富なバリスタは「早すぎて覚えられない」と言い、途中で諦めてしまった。

これは5月23日の雲奇会議武漢サミットで起こった。ヤン・ジージエ氏はアリババ機械知能技術研究所の音声インタラクションの上級科学者である。ヤン・ジージエ氏の2度目の話を聞いた後、人間のバリスタは2分37秒で注文を完了したが、機械はわずか49秒しかかからなかった。

「今日、私たちは機械が人間の話し言葉を理解する能力を新たなレベルに引き上げました」とヤン・ジージエ氏は語った。このインタラクション方法は、「音声ウェイクアップ + 音声コマンド」という従来の命令型インタラクション方法を完全に打ち破ります。当社の先駆的なストリーミング マルチインテント音声言語理解エンジンは、人間の日常的で自然な話し言葉の理解を大幅に向上させ、ウェイクアップなしで自然な人間とコンピューターのコミュニケーション スタイルの音声対話を実現できます。

上記の注文プロセスには、注文の変更、削除、追加などの複数回のダイアログが含まれます。コミュニケーションプロセス全体を通じて、顧客は「こんにちは、注文機」などの退屈なウェイクアップの言葉を言う必要がなく、直接注文することができ、これは人々の間の自然な会話にさらに沿っています。

Yan Zhijie 氏によると、これらのモジュールは単純にカスケード接続されるのではなく、公共の場の強い騒音環境での信号処理と音声認識、ビデオ認識と顔認識、シーン認識、その他のマルチモーダル融合知覚インテリジェンスを含む、深く統合されてマルチモーダル音声インタラクション ソリューションを形成します。同時に、ストリーミング ダイアログ、マルチラウンドおよびマルチインテントの音声言語理解、ビジネス ナレッジ グラフの適応などの認知インテリジェンスも統合します。

Alibaba Cloud のソリューションは、レジ機能に加えて、地下鉄のチケット販売もできるとされています。現在、上海地下鉄はこの技術を導入しています。乗客は目的地を言うだけで、券売機が適切な停留所とルートを選択します。これは上海に到着したばかりの乗客にとって特に役立ちます。 10 を超える路線と 300 を超える駅を前にすると、誰でも混乱するでしょう。テストデータによると、通常のチケット購入には 30 秒以上かかることが多いのに対し、音声チケット購入には約 10 秒しかかかりません。

Yan Zhijie 氏は、適応型ビジネス ナレッジ グラフのテクノロジを利用することで、このソリューションをより多くのシナリオに迅速に実装できると紹介しました。実装されているシナリオには、車載音声アシスタント、電話によるインテリジェントな顧客サービス、リモコンなしで操作できる遠距離音声テレビ、複数の人の会話を正確に区別できるスマートマイクなどがあります。 「将来的には、公共空間にあるあらゆるものが相互に通信できるようにしたいと考えています。」

アリババクラウドの製品ディレクターである何雲飛氏は、アリババクラウドは昨年「産業用AI」戦略を提示し、AI技術を業界に統合し、株価を吊り上げるためのマーケティング用語とならないように業界に呼びかけたと述べた。コーヒーの注文から地下鉄の切符の販売まで、私たちは AI が実際の業界のシナリオでその価値を実現できるようにしています。これは、研究室でスキルを披露する AI よりも有意義で、重要なことです。

アリババクラウドは、これらのソリューションのほかに、ET シティブレイン、ET インダストリアルブレイン、ET メディカルブレインなどを含む ET ブレインもリリースしているとのことです。現在、ET インダストリアルブレインは工業製造企業が数十億ドルの利益を生み出すのを支援しており、ET シティブレインは杭州、マカオ、クアラルンプールなどの都市に導入され、交通の最適化や安全な都市などの責任を担っています。

<<:  馬化騰:テンセントはクラウド時代に「3つのネットワーク」を構築する

>>:  テンセントクラウドは、351の都市指標を網羅した「クラウド利用状況」レポートを発表した(レポートのダウンロードリンクを添付)

推薦する

2021年、中国の基礎クラウドサービス産業の市場規模は2,256億元に達した

今年、国内クラウドサービス市場規模は2,256億元と過去最高を記録した。感染症の流行によりオフライン...

ウェブマスターネットワークからの毎日のレポート:電子商取引税は世界的な問題です。FirefoxがiOSプラットフォームから撤退

1. 「電子商取引税」をめぐる議論:存続と公平性のどちらが重要か?オンラインストアへの課税は新しい話...

2013 年のマーケティング事例トップ 10: 誰がニホンジカを殺したのか?

1. 佳多宝ごめんなさい:悲劇的なマーケティングの先駆者。2. 国内映画マーケティング:ソーシャル映...

SEOの使命は使いやすいウェブサイトを作ることです

最近よく聞くのは、誰かのウェブサイトがブロックされた、誰かのウェブサイトが復旧した、百度がまたおかし...

タオバオオンラインストアの譲渡が一部解除、離婚と相続に限定

証券時報記者 朱凱総規模が700万店に達したタオバオオンラインストアにとって、取引数や賞賛率といった...

過去のデータ:香港クラウドサーバー(2G防御)、湖北クラウドサーバー(100G防御)、初月50%オフ、月額12元から

国内のマーチャントである XiRiData は 年に設立され、主に湖北省十堰と香港 HKBN でクラ...

エンタープライズレベルのクラウドコンピューティングは、アプリケーションとITアーキテクチャの近代化を加速します

クラウド コンピューティングは、デジタル経済における新たな IT 標準として急速に普及しつつあります...

HarmonyOSが配布するTikTok風アプリ

[[430075]]詳細については、以下をご覧ください。 51CTOとHuaweiが共同で構築したH...

弾性スケーリングのための5つの条件と6つの教訓をまとめました

序文弾力的なスケーリングは、クラウド コンピューティング時代がもたらしたコア テクノロジーのメリット...

デジタル音楽の合法化により、音楽ウェブサイトでのダウンロード課金が加速

Googleが中国での音楽検索サービスを放棄し、Baiduが自社の音楽リソースを統合して本物の音楽を...

cheapvpsllc-10$/年/128MB RAM/10GB HDD/250GB Flow/サンノゼ

cheapvpsllc のボスである bline79 が、小メモリ VPS: zhuice10 の割...

APP開発者はWeChatパブリックアカウントを設定:プロモーションコストはAPPよりも高い

利点: 低コスト、高いインタラクティブ性 欠点: プロモーションが難しい、フレームワークの制約が多す...

Pacificrack の「Simple Application Server」(PR-N) シリーズ VPS の簡単なレビュー

Pacificrack は最近、「Simple Application Server」という新しい ...

ウェブサイトの美化: 見栄えの良いファビコンをウェブサイトに追加する

「ファビコンって何?」私たちはほぼ毎日ファビコンを目にしますが、注目している人は多くありません。しか...

メールマーケティングをより効果的にする方法

重要なインターネット マーケティング手法としての電子メール マーケティングは、これまでインターネット...