記者らは、ダブル11の前夜、アリババのAIバーチャルキャスターがタオバオ生放送ルームに登場し、ダブル11の実際のキャスターに代わったことを知った。このバーチャルキャスターは形も精神も備えており、声、感情、動きは実在の人物に近い。彼は、何百万人もの視聴者と聞き、話し、流暢にコミュニケーションできるだけでなく、ダンスやラップ、さまざまな複雑な動きをすることもできます。アリババのAIバーチャルアンカーが、ジバンシィ、ロレアル、ネスレなどの小売業者のライブ放送ルームに近々導入される予定だと報じられている。 ライブストリーミングは、電子商取引、金融などの分野で標準となっています。実際のアンカーはコストが高く、オンライン時間が限られているため、認知能力を備えた仮想アンカーが実際の人間に代わる最良の選択肢となっています。 従来のバーチャルヒューマンの機械的な表現とは異なり、アリババのバーチャルアンカーは、DAMOアカデミーの最先端の認知インテリジェンスと知覚インテリジェンス技術の統合をリードしてきました。生放送の状況に応じて、表情や動き、生放送内容がリアルタイムで変化します。例えば、アリババが独自に開発したディープネットワークモデルに基づき、バーチャルキャスターが「OMG!」などのキャッチフレーズを叫ぶと、それに応じた口の形、表情、ボディランゲージの動きを見せて驚きを表現します。さらに、バーチャルアンカーはライブ放送室の何千万人ものユーザーとリアルタイムでやり取りすることもできます。チャットでも、製品に関する質問でも、バーチャルアンカーがリアルタイムで応答します。 タオバオのライブ放送室でも、狭帯域高解像度や大規模低遅延などの基本的な革新技術が採用されていると報じられている。たとえば、低遅延テクノロジーにより、世界中のさまざまな環境やさまざまなデバイスの消費者が画像と音声を同期して受信できるようになります。 DAMOアカデミーのインテリジェントサービスチームの責任者である趙坤氏は、「バーチャルアンカーの背後には、視覚、音声、自然言語処理などのマルチモーダル融合アルゴリズムを網羅した複雑なアルゴリズムとエンジニアリングシステムがあります。これは、機械が人間と自然にコミュニケーションするための基礎です。今後、私たちはこのヒューマンコンピューターインタラクション技術を金融、教育、医療などの分野に応用していきます」と語った。 |
<<: 分散コンセンサスアルゴリズム EPaxos について 1 つの記事で学ぶ
>>: ファーウェイの洪方明氏:クラウドイノベーションは政府と企業のインテリジェントアップグレードを加速する
ウェブサイトの所有者は皆、ウェブサイトが長期的な発展を遂げたい場合、その基礎は収益モデルや経営管理で...
クラウド テクノロジーが IT 業界を席巻している今日、クラウド コンピューティングの出現後に会社が...
vmiss は、米国ロサンゼルスで China Unicom AS9929 ハイエンド ラインの V...
現在、インターネット上にはウェブサイトのランキングに関する新しい概念があり、SEO 担当者はこれを投...
1. 知乎の若者の悩み:国内のトラブルと海外の敵、ユーザーの熱意が失われている「中国のQuora」と...
DigitalOcean は 5 月に最初の割引コードをリリースしました: SSDMAY10。この割...
最近、「IT 敗者の告白」というタイトルのビデオがインターネット上で人気を集めています。このビデオは...
クラウドコンピューティングの発展の歴史は、仮想化技術の発展の歴史でもあります。過去 20 年間、クラ...
UPS 電源を使用すると、さまざまなアラームが表示されます。それぞれのアラームには異なる意味がありま...
企業内のテクノロジーや運用方法は、頻繁に変化します。もちろん、大きな変化が起こるたびに市場の動向に追...
David Eastman 氏は、コンテナ以前 (Chef 以前!) のソフトウェア ツールである ...
米国スピンサーバーズ社のダラスデータセンターでは、12コア24スレッド、32Gメモリ、24T SAS...
2月2日、Namecheap.comは、.com、.net、.org、.biz、.infoドメイン名...
Ninjahawk は、米国ニューヨークに登録されているホスティング プロバイダーです。サーバー構成...
2011年第1四半期以降のVipshopの収益2011年第1四半期以降のVipshopの純利益推移チ...