デジタル時代は常に最前線にあり、激動のテクノロジー界に身を置くことで、最先端の開発から業界の動向やトレンドを感じることができます。物理と仮想が融合したこの新しい時代において、AI 駆動の AI アシスタントは、インターネット時代の PC やモバイルインターネット時代のスマートフォンのようなものであり、私たちがインテリジェント時代に入るためのスーパーエントランスとなります。 「未来の経済、デジタルファースト」をテーマにした2020年テンセントグローバルデジタルエコシステムカンファレンスでは、AI業界の専門家がAIアシスタントの進化における最新の成果について議論することに集中しました。インテリジェント インターネット時代の人間とコンピューターのインタラクションの入り口として、AI アシスタントは AI を活用した業界ソリューションをもたらします。 AI音声対話機能を中核とし、ナレッジグラフの作成、IP仮想イメージ、全二重などの有利な機能を組み合わせることで、従来の会話型ロボットを全面的にアップグレードし、AIアシスタントが社会人の属性も持つことを可能にします。 簡単に言えば、AI アシスタントは、よりパーソナライズされ、シナリオベースで、感情的なニーズを満たすことができ、企業が効率を改善し、コストを節約し、「仕事」の成果を向上させるのに役立ちます。これらすべては、技術的な観点から見ると、AI 音声アシスタントの「脳の開放」と切り離せないものです。 「テンセントクラウド小威、デジタル人材を育成し、業界のアップグレードを支援する」をテーマにしたフォーラムでのテンセントインテリジェントプラットフォーム副社長の李雪超氏の講演に合わせて、AIテクノロジーを活用したAIアシスタントの技術とアプリケーションのアップグレードを見てみましょう。
全二重インタラクションにより、AIアシスタントとの自然な会話が可能になり、感情的な音声インタラクションが実現します。 技術的な観点から見ると、AI アシスタントとの会話型のやり取りを実現することは難しくありません。 「今日の天気はどうですか?」などの一般的な指示に直面したとき、または音楽の再生などの単純なタスクを実行する場合、すべての質問と回答は音声による対話の範囲内になります。 しかし、インタラクションをコミュニケーションに変換し、実際のビジネス シナリオのニーズにより適した自然でスムーズな会話体験を実現するには、技術面での技術革新を通じて AI アシスタントに感情的な魂を与える必要があります。 この目的のために、テンセントクラウド小威AI音声アシスタントは、全フィールドおよび全二重モードですべてのビジネスシナリオをカバーし、ASR + NLP双方向拒否判定(誤認識率<0.01および拒否率<0.1)で誤った応答の可能性を大幅に削減し、低遅延のストリーミングセマンティクス+セマンティックVADで真に聞きながら同時に考えるソリューションを提供します。これらが一緒になって、AIアシスタントとの自然な会話の基礎を形成します。 全二重インタラクションでは、1 回のウェイクアップで複数ラウンドの連続した無料会話を実現でき、いつでも中断できます。 AIアシスタントは、関連する指示を正確に拾い上げ、正しいフィードバックを与えることもできます。 「シンプレックス」や「半二重」の技術と比較して、双方向のリアルタイム通信を実現できます。単一のシナリオにおける全二重相互作用技術は、比較的簡単に理解できます。たとえば、音楽を再生しているときに、「今再生されている曲の名前は何ですか?」などのコマンドを継続的に与えることができます。そして「この曲を集めるのを手伝ってください。」
同時に、Tencent Cloud Xiaowei AI Voice Assistant によって実装された AI アシスタントには、音声対話、自然言語理解、声紋認識、画像認識などの AI 機能も統合されています。さまざまなシナリオにおける複雑なノイズに対して的を絞って技術力を向上させ、複雑なノイズ環境における起動率、音声認識精度、意図理解精度を継続的に向上させ、ユーザーに自然で豊かなインタラクティブ サービスを提供します。その中で、ASR+NLP双方向拒否判定は技術的な特徴であり、誤認識率<0.01、拒否率<0.1で、誤った応答の確率を大幅に低減します。 さらに、自然なコミュニケーションにおける理解から正確な表現へと進むためには、AI アシスタントはストリーミング セマンティック処理において飛躍的な進歩を遂げる必要があります。 Tencent Cloud Xiaowei AI音声アシスタントは、200ミリ秒単位で音声をアップロードできるため、クラウドブレインが聞くと同時に考えることが可能になり、シーンとコンテキストを組み合わせてユーザーのセマンティクスを予測し、事前に返答方法を考え、低遅延特性の下で応答を高速化します。 ナレッジグラフはAIアシスタントの生産性を向上させ、AI音声アシスタントの進歩への足がかりとなる 会議で、李雪超氏はAIアシスタントの専門性について次のように意見を述べた。「人工知能は人工知能ではありません。雲小薇の知識グラフ機能は、ロボットの頭脳として、専門知識をネットワークで結び付けます。直線的に考えるだけでなく、推論や判断もでき、より専門的なビジネスサービスを提供できます。」 実際、AI の分野では、ナレッジ グラフの重要性は現在も将来も自明です。人工知能にとってナレッジグラフの重要な価値は、知識が人工知能の基礎であるという点にあります。機械は視覚や聴覚といった人間の知覚能力を模倣することができますが、この知覚能力は人間に限ったものではありません。動物にも知覚能力があり、犬の嗅覚など、一部の知覚能力は人間よりもさらに優れています。 生産性を効果的に向上させるために、AI アシスタントに認知能力を与えるにはどうすればよいでしょうか? Tencent Cloud Xiaowei のアプローチは、プログラム設計における AI アシスタントの「成長」体験を詳細に示しているため、検討する価値があります。 1 つ目は、知識抽出を通じて業界知識グラフを構築することです。 AI アシスタントが業界知識をより深く理解できるようにするために、Yunxiaowei ナレッジ グラフ プラットフォームは業界データからの業界知識の抽出をサポートし、業界パートナーが業界固有のナレッジ グラフを構築できるように支援します。例えば、観光業界では、AIツアーガイドの傅達人は閣僚として観光客と会話したり交流したりできるだけでなく、観光客にパーソナライズされたツアールートを推奨したり、景勝地や文化遺産について説明したり、歴史的な逸話を語ったりすることもできます。ビッグデータのサポートにより、観光業界のナレッジグラフとリソースデータがAIツアーガイド復旦大学の一般知識ベースに継続的に流入し、AIアシスタントが業界サービスで重要な役割を果たすことができるようになります。 2 つ目は、知識の統合を通じて業界の知識のサイロを打破することです。業界間の知識サイロを打破するために、雲暁衛は自社の膨大な一般知識を中心に据え、エンティティリンクや属性融合などのさまざまな知識融合技術を通じて、さまざまな業界の知識グラフを接続します。例えば、AIアシスタントカスタマーサービスアプリケーションの実装において、Tencent Cloud Xiaowei AI音声アシスタントはナレッジグラフの役割を重視し、テキストパターンをナレッジベース検索、プリセールスサービス、アフターサービスなどのモードに分類し、検索は機能検索となります。プリセールスとアフターセールスは、質問回答戦略に基づいて手動モードに切り替えることができます。階層型モジュールの構築は、知識ベースの基本的な構築に重点を置いており、モジュールの分担が明確になり、プロセスがシンプルになります。 3つ目は、知識の関連付けを通じて業界のリソースデータを統合することです。知識の関連付けを通じて、複数のソースの異種業界リソースが知識グラフにリンクされ、知識脳が形成され、デジタル従業員に豊富な能力が与えられます。この AI アシスタントは、可視化技術を使用して知識リソースとそのキャリアを記述し、知識とその相互関係をマイニング、分析、構築、描画、表示し、業界知識、リソースデータを一般的なグラフに関連付け、ナレッジブレインを形成し、AI アシスタントを質疑応答、可視化、データガバナンス、プロアクティブサービスなどの機能を備えたナレッジグラフプラットフォームにします。 そのため、AI技術はさまざまな分野において、断片化されたマルチモーダルなデータを抽出、融合、関連付けてナレッジグラフを形成し、元のデータを効率的に活用した上で、データ推論、モデル応用分析をサポートし、専門能力の向上を真に実現します。
人工知能の継続的な進歩により、AIはもはや冷たい技術ではなく、人間がスマートな生活を楽しみ、感情の世界を守るのに役立つ優れたヘルパーへと進化しました。その中で、バーチャルツアーガイド、バーチャルカスタマーサービス、バーチャル教師など、AIアシスタントによって実現されるデジタル従業員は、豊富なIP画像ライブラリ+繊細な感情表現を使用して、AIアシスタントがもたらす人間とコンピューターのインタラクション体験をより鮮明にします。 例えば、AIアシスタントの画像作成では、Tencent Cloud Xiaowei AI Voice Assistantが提供する仮想画像サービスを通じて、Tencent Cloud Xiaowei AI Voice Assistantは音声認識から画像出力までを含む完全なフルチェーンソリューションを提供します。お客様は、実際の使用シナリオのニーズに基づいてさまざまなソリューションを選択できます。イメージに要件がある場合、Tencent Cloud Xiaowei は企業専用の 2D\3D イメージの作成をサポートします。 Tencent Cloud Xiaowei は、認証のために Tencent の膨大な IP リソースとも連携しています。企業は人気のある IP を組み合わせて、より特徴的なデジタル サービスを作成し、より多くの注目と話題を集めることができます。 例えば、仮想顧客サービスのアプリケーションでは、AIアシスタントはAIを使用して顔の表情を自動予測し、唇の形をリアルタイムで処理し、音声合成技術を使用して、実際の人間に匹敵するほどリアルな効果を実現します。 50 種類以上の男性と女性の音声、パーソナライズされた音色のカスタマイズ機能、Honor of Kings の Daji と Li Bai のカスタマイズされた音声パッケージを提供します。業界をリードするアルゴリズムを使用してさまざまなシナリオで音声の音色を最適化し、音声認識や意味理解などのインテリジェントなインタラクション技術も使用して、AI音声アシスタントがより自然に話すようにします。 感情表現が必要な場合、AIアシスタントの繊細な感情表現技術ソリューションを通じて、ユーザーとのインタラクション中に仮想人物の感情を身体の動き、表情、音声感情で表現することができ、仮想人物のパフォーマンスをより感情的にすることができます。 例えば、今回のカンファレンスに登場した『鏡の国のアリス』のヒロイン、ナ・シェンは、アニメの世界からフォーラムにやって来て、雄弁で、考え、推論し、判断することができ、超ビジネス能力を備えたAIアシスタントに変身しました。彼女は話している間の表情や動作で感情を表現し、ロボットのサービスは冷たいものではなく、より立体的で温かいものになりました。
デジタルの未来を受け入れ、プロフェッショナルで自然で生き生きとした AI アシスタントの「未来コード」とは何でしょうか? 最先端の技術から産業実装までどのくらいの距離があるのでしょうか?デジタル化の波の中で、プロフェッショナルで自然で生き生きとした AI アシスタントは、間違いなく業界のアップグレードの信頼できる推進力となるでしょう。 5Gの高帯域幅とリアルタイムコンピューティングの継続的な強化により、AIアシスタントの応用シナリオはさらに活性化されます。 李雪超氏は将来について、「テンセントクラウド小威は今後も有利な軌道に注力し、シナリオに基づいた製品機能を構築していきます。旅行、政府関係、文化観光、教育などの業界では、テクノロジー、製品、シナリオのソリューションを通じて、企業のコスト構造を最適化し、新たな業界価値を探求し、新たな業界の勢いを生み出していきます」と語った。 AIアシスタントは、ますます自然な人間とコンピュータのインタラクション方法を活用し、IP仮想画像と音声インタラクションを組み合わせ、文化観光、オンライン教育、顧客サービスなどの分野で頻繁に利用されるようになっています。豊かで鮮明な画像は、サービス価値を高めるために詳細にカスタマイズすることもできます。 AI アシスタントは、インテリジェンスを完全に接続した新しいエコシステムとして、強力な AI 機能を活用して、業界が需要からサービス満足度までのスマートなリンクをユーザーに提供できるよう支援します。たとえば、仮想顧客サービスのアプリケーションでは、AI アシスタントはよりスマートになり、ユーザーのニーズをよりよく理解し、即時かつスムーズな応答を提供するため、ユーザーエクスペリエンスが大幅に向上します。同時に、アルゴリズムの最適化を通じて旅行生活に利便性を加え、ユーザーが些細な事柄について決定を下すのを助け、「情報の利便性」を利用して「物理的なエネルギー消費」を減らし、より価値のある場所でエネルギーを活用できるようにします。 今後も AI アシスタントは産業相互接続に新たな推進力を提供し続け、企業のサービス レベルの向上を継続的に支援し、消費者に優れたユーザー エクスペリエンスをもたらします。 |
<<: PICC Auto ServiceとAlibaba Cloudが共同で保険業界クラウドを構築します。プロジェクトの第 1 フェーズでは、企業が災害復旧コストを 50% 削減するのに役立ちます。
>>: アマゾン ウェブ サービス (AWS) の機械学習サービスである Amazon SageMaker が中国で利用可能になりました
この記事は、ビリビリにおける重要なグループであるジェネレーションZについて深く分析し、ジェネレーショ...
Chicagovpsからメールが届きました:9月8日、有名なデータセンターColorcrossing...
[[393678]]この記事はWeChatの公開アカウント「New Vision of Progra...
検索エンジン(ここでは百度)にとって、外部リンクは王様であるという格言は誰もが知っていると思います。...
過去数十年にわたり、オンプレミス ソフトウェアからクラウド コンピューティングへの大きな移行がありま...
最適化の方法としては、ホワイトハットとブラックハットに分けられます。 2 つの最適化方法の性質は逆で...
ここで言うキーワード リンクの一意性は、外部リンクではなく、Web サイト内のキーワードの URL ...
何らかの理由で、元のサーバースポンサーがネットワークケーブルを抜いてしまい、ウェブサイトにアクセスで...
多くの人がサンフランシスコに金採りに行ったが、結局金採りをする人たちは金持ちにならず、金採りをする人...
「企業がデジタル変革技術と持続可能な開発の両方に注力すれば、これら2つの成長エンジンによって同業他社...
weloveservers、1Gメモリ特別版の説明:サーバーはIntel Xeon Quad-Cor...
プロデューサー:張勇、企画:沈塵、脚本:張博文、劉睿、劉美燕2015年、ゲーム業界で最もホットな話題...
新たな IT トレンドのほとんどと同様に、「エッジ コンピューティング」は革命ではなく、むしろ進化で...
Linode は Akamai に統合された後、現在ではインドのチェンナイとムンバイに 2 つのデー...
cmivps 香港 VPS が再入荷しました。KVM 仮想\SSD、3 つのネットワークへの直接接続...