テンセントクラウド小威などの音声アシスタントは進歩を続け、AI音声技術の応用と生態学的統合

テンセントクラウド小威などの音声アシスタントは進歩を続け、AI音声技術の応用と生態学的統合

少し前、マイクロソフトは人工知能「Xiaoice」事業を独立企業として分離することを正式に発表し、マイクロソフト「Xiaoice」が正式に中国と「結婚」し、独自の道を歩み始めたことを示しました。人工知能分野のスター製品の一つであるマイクロソフトXiaoIceが独立企業として中国市場に参入したことは、AI音声分野での熾烈な競争の中で重要な出来事とみなされている。

Microsoft Xiaoice が単独で活動することを選んだのはなぜですか?その理由は、「Xiaoiceの父」Li Di氏の「AI時代には、いくつかの新しいビジネスモデルがあるはずです。Xiaoiceはまずこれらの新しいビジネスモデルをテストする必要があります。Xiaoiceは商業化において非常に抑制されています。」という発言から理解するのは難しくありません。 Microsoft Xiaoiceは2014年の誕生以来、6年間AI音声アシスタントの道を模索し、オープンかつ協力的な方法でAI音声アシスタントの統合開発の限界を模索してきました。

音声インタラクション市場は注目されています。 AI音声アシスタントの開発の方向性は?

Microsoft Xiaoice が独立して運営しようとしているのは偶然ではありません。音声は一般的に、将来の人間とコンピュータの相互作用への入り口であると考えられています。ユーザーは音声を通じてスマートデバイスと対話します。そのため、AI音声アシスタントの分野における商用化プロセスは常にIoT市場と深く結びついており、AmazonのAlexa、Google Assistant、Tmall Genie、BaiduのXiaodu、XiaomiのXiaoaiなどのスマートスピーカー製品が誕生しました。スマートスピーカーは、AI音声アシスタントの代名詞にもなっています。

しかし、どうすれば「小型」スマートスピーカーが AI 音声アシスタントの「野心」を実現できるのでしょうか?現在、音声アシスタントの分野に目を向けると、すでに多くの競合企業が商用化に向けて歩み始めています。例えば、XiaomiのXiao Aiは、家庭内相互接続に重点を置いた、より多くのXiaomiおよびエコチェーン製品に搭載されています。 Tmall Genie は Alibaba の大規模なエコシステムレイアウトに重点を置いています。 Tencent Cloud Xiaoweiは、Tencentのエコシステムネットワークを基盤とし、Cエンドへのサービス提供におけるTencentの長年の経験を組み合わせ、Bエンドのエコシステムを構築し、スマートライフのさまざまなシーンに浸透するためのヘルパーとしての役割を果たします。

現在の AI 音声アシスタントがエコロジーをキーワードとして重視していることは明らかです。 Baidu Voiceを例にとると、Baiduは人工知能技術、コンテンツエコロジーなどの優位性を生かし、人工知能、知覚技術、データ駆動型などの技術に基づく業界ソリューションを作成し、金融分野のパートナーエコシステムを構築し始めています。同時に、Alibaba Voice AI は多数の ISV とチャネル パートナーを集め、インテリジェント音声市場において軽視できないエコシステム パワーとなっています。 Alibaba AI Voiceとその関連ソリューションは、国内の2大通信事業者と約10社の仮想通信事業者の20以上の省のネットワークをカバーしています。テンセントが所有するTencent Cloud Xiaowei AI音声アシスタントは、Bエンド市場の発展に多大な努力を払い、スマート家電、自動車、その他の多次元分野と連携しています。

テクノロジー志向のエコロジカルな価値が境界を打ち破り、音声インタラクションの多様な可能性を解き放つ

5G技術の普及に伴い、業界では分散化が常に話題になっています。デジタル時代の消費者のモバイルライフのニーズは、単一のシナリオの製品やサービスではもはや満たすことができず、あらゆる分野が行き詰まりを打破する方法を積極的に模索しています。

複数の業界を巻き込んだ AI 音声エコシステムの構築において、AI 音声アシスタントは、デバイスやコンテンツの API および SDK インターフェースを通じて、音声認識、自然言語処理、音声合成、画像認識などの複数の AI 機能を統合して初めて、さまざまな業界にプラットフォームレベルのビジネスサポートを提供できます。

ポストコロナ時代を迎え、半年間休眠状態にあった観光産業が回復しつつある。防疫・管理の正常化の要請を受け、観光業界も時代の流れに沿ってデジタル変革を積極的に推進し、サービスレベルを向上させる必要がある。例えば、AR+シーンイノベーション、観光アプリコンテンツ開発、ビッグデータプラットフォーム、インテリジェントロボット、音声ナビゲーションなどのテクノロジーを通じて、文化と観光の消費シーンの体験を向上させることができます。 Tencent Cloud Xiaoweiを例にとると、AI音声アシスタントとTencent Mapsを組み合わせ、仮想アシスタントのイメージと音声対話技術を活用して、観光スポットのインテリジェントガイドサービスを提供します。故宮AIガイド「福達人」や龍門石窟AIガイド「阿難」などのイメージに変身し、観光客にパーソナライズされた観光ルートの推奨、景勝地や文化遺産の解説、百科事典Q&Aなどのサービスを提供し、観光産業のデジタル変革の革新的な代表者となった。 「文化+観光+テクノロジー」の深い融合を通じて文化観光産業チェーンを再構築することで、AI音声アシスタントと文化観光IPの組み合わせが新たな産業成長ポイントになりつつあります。

さらに、運転中の「オフライン不安」という問題に直面し、自動車の使用のあらゆるシーンでシームレスでインテリジェントな体験を真に実現する方法が、現在自動車会社を悩ませている問題の核心です。この次元では、インテリジェント音声テクノロジーがこの問題点を非常にうまく解決できます。オープンテクノロジーと端末を組み合わせることで、運転中のユーザーの情報やエンターテイメントサービスのニーズを効率的に解決できます。音声制御を通じて、ナビゲーション、音楽、オーディオブック、情報検索などの情報サービスを実現でき、インテリジェントな車両制御への入り口にもなります。

[[335847]]

上記の 2 つの応用シナリオに加えて、AI 音声アシスタントは多くの分野で役割を果たすことができ、スマート ロボット、スマート TV、スマート スピーカー、スマート ウェアラブルなどのアプリケーション指向の AI ソリューションを提供し、ハードウェア デバイスへの効率的なアクセスとエコ サービスの簡単な接続を実現します。

生態学的価値の利点は「成長の力」にあり、特定の最終製品に限定されるのではなく、国境を越えた生態学と統合されたサービスがリソースを共有できるようにします。巨大な想像力の可能性を解き放ち、業界の境界を打ち破ります。

今日の社会では、新たな科学技術革命と産業革命が本格化しています。 AI音声アシスタントは、将来の技術発展の重要な部分として、全体的なエンパワーメント、共同所有、国境を越えたエコロジーを通じて徐々に進歩し、持続可能な発展のための業界ソリューションを提案し、業界エコロジーを共同で構築しており、次の傾向を示しています。

1. AI音声アシスタントは、パーソナライズされた、感情的な、シナリオベースのサービスを提供する能力が高い

ビッグデータ環境において、人工知能の音声はますます高度かつインテリジェントになっています。スマートハードウェア製品の市場拡大に伴い、製品のインタラクション体験が大幅に向上し、ユーザーの意識と習慣が培われました。同時に、より細分化されたユーザーと市場に直面して、音声アシスタントはデジタルヒューマンテクノロジーと組み合わされ、人間の言語会話の感情的特性に適合するより擬人化されたイメージに変換され、教育シナリオでの仮想教師、文化と観光シナリオでの仮想ツアーガイド、政府シナリオでの仮想顧客サービスなど、シナリオに基づいてターゲットを絞ったサービスを提供します。

[[335848]]

2. コラボレーションとオープン性が主なテーマとなり、エコロジカルな開発が一貫したサービスを形成する

将来、AI 音声アシスタントは協調的かつオープンなものになるでしょう。まず、人間と人工知能が協調的に共存し、次に、人工知能がクラウドから末端までオープンに接続されるようになります。制御性とセキュリティを前提として、スマート端末の相互接続を実現し、最終的には端末やシナリオをまたいで継続的なスマートサービスを形成できます。

3. 技術は進歩を続け、人間とコンピュータの自然な対話モデルを形成するだろう

全二重技術が成熟するにつれて、AI 音声アシスタントは、単一のウェイクアップから、1 回のウェイクアップ、継続的な会話、聞くことと話すことへと徐々に移行し、人間の対話の状態に近づいています。さまざまな音声アシスタント企業が公開したデモから、全二重技術の応用が議題に上がるべきだったことがわかります。将来的には、音声対話、画像認識、パターン認識などの助けを借りて、機械が人の表情を読み取る能力も持つようになり、より多くの市場スペースが生まれるかもしれません。

調査と市場予測によると、世界のインテリジェント音声市場は引き続き急速に成長し、2020年までに市場規模は191億7,000万米ドルに達する見込みです。その中で、2021年までに中国のインテリジェント音声市場規模は194億8,000万元に達すると予想されています。数百億規模のスマート音声市場における競争はますます激化している。スマート音声技術がスマートカー、教育、文化観光、家庭など多くの分野に深く応用され続けることによってのみ、将来の発展にさらにうまく統合され、より多くの企業がインテリジェント化とデジタル化を実現できるようになります。

<<:  アリババクラウドが3つの新しいスーパーデータセンターを建設、100万台以上のサーバーを追加

>>:  毎日4000万人のアクティブユーザーを抱えるTom Catゲームファミリーは、AWSクラウドサービスを使用して「シームレスな」ユーザーエクスペリエンスを実現しています。

推薦する

2018年:中国のクラウドコンピューティング業界の転換点

投資ポイント世界の IT 支出に占めるクラウド コンピューティング支出の割合は増加し続けています。世...

マルチクラウド環境におけるリスク管理

企業が業務を複数のパブリック クラウドに移行するにつれて、リスクも変化します。企業は、マルチクラウド...

APPプロモーション:主流の顧客獲得チャネルと方法

アプリ開発技術の発展と開発コストの削減により、ますます多くのインターネット企業が独自のアプリを開発す...

キーワードのランキングサイクルを短縮するにはどうすればよいでしょうか?

多くのウェブマスターはこのタイトルを見て、私が異常なブラックハット手法について話していると思ったでし...

spinservers: サンノゼ専用サーバー、100M\1Gbps\10Gbps の帯域幅、無制限のトラフィック、月額 119 ドルから、超高構成、期待以上

中国の伝統的な旧正月である春節を祝うために、スピンサーバーは米国西海岸のサンノゼデータセンターに「無...

Neosurge128M小メモリXENVPSが利用可能

Neosurge の VPS ホスト cat は 3 回言及されています (詳細については を参照)...

マルチテナントクラウドプラットフォームの導入方法を学ぶ

[[437680]] [51CTO.com クイック翻訳]パブリッククラウドを信頼できますか?答えは...

Baidu の入札は非常に強力ですが、SEO はどこに向かうべきでしょうか?

百度の入札力はこんなにも強いのか?SEOはどこへ向かうべきなのか?中国の現状から判断すると、百度は約...

マイクロソフト、クラウド環境向けセキュリティ評価アプリケーション「Cloud Katana」をオープンソース化

[[420614]]テクノロジー大手の Microsoft は最近、クラウドおよびハイブリッド クラ...

簡潔な分析: 地方タレント局が窮地を乗り切る方法

私がこの記事を書いた主な理由は、私自身が人材ネットワークの構築に取り組んでいるのですが、実際にそれを...

VPSHostingDeal-$12/年/256MB RAM/20GB HDD/500GB Flow/シアトル

VPSHostingDeal.com は、Reprise Hosting (AS62838) の V...

来年のIT技術の発展動向

年末が近づいている今こそ、企業が情報に基づいた意思決定を行う準備ができるよう、今後 1 年間の業界動...

ブランドポジショニングとブランドプレースメントとは何ですか?この2つの違いは何でしょうか?

オンラインブランド配置シリーズ2 :この記事は主に次の 3 つの部分で構成されています。 1. ブラ...

JD.comの子会社MiniTiaoは、同社が賃金を滞納していることを明らかにし、親会社を公に非難した。

上場を控えたJD.comは、Yixunとの統合危機に直面したばかりだ。その後すぐに、主に日本と韓国の...