記者らは、ダブル11の前夜、アリババのAIバーチャルキャスターがタオバオ生放送ルームに登場し、ダブル11の実際のキャスターに代わったことを知った。このバーチャルキャスターは形も精神も備えており、声、感情、動きは実在の人物に近い。彼は、何百万人もの視聴者と聞き、話し、流暢にコミュニケーションできるだけでなく、ダンスやラップ、さまざまな複雑な動きをすることもできます。アリババのAIバーチャルアンカーが、ジバンシィ、ロレアル、ネスレなどの小売業者のライブ放送ルームに近々導入される予定だと報じられている。 ライブストリーミングは、電子商取引、金融などの分野で標準となっています。実際のアンカーはコストが高く、オンライン時間が限られているため、認知能力を備えた仮想アンカーが実際の人間に代わる最良の選択肢となっています。 従来のバーチャルヒューマンの機械的な表現とは異なり、アリババのバーチャルアンカーは、DAMOアカデミーの最先端の認知インテリジェンスと知覚インテリジェンス技術の統合をリードしてきました。生放送の状況に応じて、表情や動き、生放送内容がリアルタイムで変化します。例えば、アリババが独自に開発したディープネットワークモデルに基づき、バーチャルキャスターが「OMG!」などのキャッチフレーズを叫ぶと、それに応じた口の形、表情、ボディランゲージの動きを見せて驚きを表現します。さらに、バーチャルアンカーはライブ放送室の何千万人ものユーザーとリアルタイムでやり取りすることもできます。チャットでも、製品に関する質問でも、バーチャルアンカーがリアルタイムで応答します。 タオバオのライブ放送室でも、狭帯域高解像度や大規模低遅延などの基本的な革新技術が採用されていると報じられている。たとえば、低遅延テクノロジーにより、世界中のさまざまな環境やさまざまなデバイスの消費者が画像と音声を同期して受信できるようになります。 DAMOアカデミーのインテリジェントサービスチームの責任者である趙坤氏は、「バーチャルアンカーの背後には、視覚、音声、自然言語処理などのマルチモーダル融合アルゴリズムを網羅した複雑なアルゴリズムとエンジニアリングシステムがあります。これは、機械が人間と自然にコミュニケーションするための基礎です。今後、私たちはこのヒューマンコンピューターインタラクション技術を金融、教育、医療などの分野に応用していきます」と語った。 |
<<: 分散コンセンサスアルゴリズム EPaxos について 1 つの記事で学ぶ
>>: ファーウェイの洪方明氏:クラウドイノベーションは政府と企業のインテリジェントアップグレードを加速する
WeChatが再びモーメントを制限しようとしていることは、皆さんもご存知だと思います。友達5,000...
共同購入業界は縮小している。 Tuan800の最新レポートによると、6月末現在、国内の共同購入サイト...
chicagovps が 9 月に実施した最初の VPS プロモーションでは、1g のメモリ、25G...
近年、ウェブマスターは安価な VPS を日々探しています。皆様の評価と個人的な意見に基づいて、ここで...
デジタル経済の時代において、クラウドコンピューティングは企業のデジタル変革を推進する重要な原動力とな...
「わずか30万元で、信託と同様の収益率の投資収益に参加できます。」商品マニュアルの関連情報は、余剰資...
2018年12月13日、中国情報通信研究院と中国通信標準化協会が主催し、TC601ビッグデータ技術標...
ここ数日、Baiduがハイパーリンク不正に関するアルゴリズムをアップグレードし、その影響が徐々に広が...
新しいテクノロジーには常に成長の痛みが伴いますが、クラウド コンピューティングも例外ではありません。...
ユーザー定義の WAN により、企業リソースへのアクセスが向上しますが、より多くのクラウド コンピュ...
一般的な投資会社が国内の投資機会を探す場合、通常は米国を参考にします。一つの方法は、中国にコピーして...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスウェブサイトの SEO ...
6月末、raksmartが開発した新製品「クラウドサーバー」が正式に販売開始されました。現在は米国シ...
まだご存じないかもしれませんが、EntryBytes は NexusBytes によって作成されたサ...
現在、SEO実践者はますます増えており、SEOはほぼすべての業界に存在します。一部の業界では、特定の...