記者らは、ダブル11の前夜、アリババのAIバーチャルキャスターがタオバオ生放送ルームに登場し、ダブル11の実際のキャスターに代わったことを知った。このバーチャルキャスターは形も精神も備えており、声、感情、動きは実在の人物に近い。彼は、何百万人もの視聴者と聞き、話し、流暢にコミュニケーションできるだけでなく、ダンスやラップ、さまざまな複雑な動きをすることもできます。アリババのAIバーチャルアンカーが、ジバンシィ、ロレアル、ネスレなどの小売業者のライブ放送ルームに近々導入される予定だと報じられている。 ライブストリーミングは、電子商取引、金融などの分野で標準となっています。実際のアンカーはコストが高く、オンライン時間が限られているため、認知能力を備えた仮想アンカーが実際の人間に代わる最良の選択肢となっています。 従来のバーチャルヒューマンの機械的な表現とは異なり、アリババのバーチャルアンカーは、DAMOアカデミーの最先端の認知インテリジェンスと知覚インテリジェンス技術の統合をリードしてきました。生放送の状況に応じて、表情や動き、生放送内容がリアルタイムで変化します。例えば、アリババが独自に開発したディープネットワークモデルに基づき、バーチャルキャスターが「OMG!」などのキャッチフレーズを叫ぶと、それに応じた口の形、表情、ボディランゲージの動きを見せて驚きを表現します。さらに、バーチャルアンカーはライブ放送室の何千万人ものユーザーとリアルタイムでやり取りすることもできます。チャットでも、製品に関する質問でも、バーチャルアンカーがリアルタイムで応答します。 タオバオのライブ放送室でも、狭帯域高解像度や大規模低遅延などの基本的な革新技術が採用されていると報じられている。たとえば、低遅延テクノロジーにより、世界中のさまざまな環境やさまざまなデバイスの消費者が画像と音声を同期して受信できるようになります。 DAMOアカデミーのインテリジェントサービスチームの責任者である趙坤氏は、「バーチャルアンカーの背後には、視覚、音声、自然言語処理などのマルチモーダル融合アルゴリズムを網羅した複雑なアルゴリズムとエンジニアリングシステムがあります。これは、機械が人間と自然にコミュニケーションするための基礎です。今後、私たちはこのヒューマンコンピューターインタラクション技術を金融、教育、医療などの分野に応用していきます」と語った。 |
<<: 分散コンセンサスアルゴリズム EPaxos について 1 つの記事で学ぶ
>>: ファーウェイの洪方明氏:クラウドイノベーションは政府と企業のインテリジェントアップグレードを加速する
ここ数年、中国の産業デジタル化プロセスは秩序正しく加速しており、多くの産業が実りある成果を達成してい...
ウェブホスティングの有名なブランドは数多くありますが、Siteground ほど評判が良いものや、S...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています2018年...
8月27日、WOT2016モバイルインターネットテクノロジーサミットが北京JWマリオットホテルで盛大...
リンク交換は、友好リンクまたは相互リンクとも呼ばれます。このようなリンクはリソースを補完することがで...
現在、ほとんどのデータ保護ソリューションは、オンプレミスのデータ保護インフラストラクチャのコストを削...
gfrack の米国 VPS サーバーは、QN のロサンゼルス データ センターでホストされています...
私は杭州にいるので、杭州19階にある最大の地元コミュニティにとても慣れているので、当然このウェブサイ...
2018年は中国のクラウドコンピューティング業界にとって転換点となる年です。政策、産業、資本の全面的...
buyvm、海外の安価なVPSを使用するほとんどの人は、それについて少しは知っているはずです。このカ...
ウェブサイトの内部ページがインクルードされないことは、ウェブマスターを悩ませる大きな問題です。一般的...
基本的なコンテナ操作コンテナの基本的な操作は主にctr imageコマンドです。コマンドヘルプを参照...
先週、Tudou、Sohu Video、LeTVが共同で技術的措置を取り、Youkuの検索エンジンを...
著者 |テンセントスターコンピューティングチーム1. 背景1.1 問題の起源近年、テンセント社内の自...
私はSEOに2年以上携わっています。この業界には常に不満な点がたくさんあります。また、何が正しくて何...