2019年デジタルエコシステムカンファレンスが5月21日から23日まで昆明で開催されました。AIサブフォーラムでは、テンセントYoutuラボの共同ディレクターで優秀な科学者であるJia Jiaya氏が、YoutuのAI手話認識における最近の画期的な成果である、独自開発のアルゴリズムに基づく「Youtu AI手話翻訳機」の発表を共有しました。 賈佳亜氏によると、AI手話翻訳機は手話収集装置として普通のカメラを使用し、バックグラウンド計算には高性能コンピューターを利用している。ユーザーがカメラに向かって手話表現を完了するだけで、翻訳機が結果を素早く計算し、手話をテキストに変換できます。将来的には、空港や民事窓口などの公共の場に導入・実装され、情報化都市の構築に貢献することが期待されます。 (テンセントYoutuラボ共同ディレクター、テンセントの著名な科学者、賈佳雅氏) AI手話翻訳機:手話認識の「ブラックテクノロジー」を実現する独自開発アルゴリズム 手話認識(SLR)とは、コンピュータアルゴリズムを使用して、手話表現におけるさまざまなジェスチャーや動き、およびこれらのジェスチャーと動きの切り替えを自動的に区別し、最終的に表現された手話をテキストに変換することを指します。しかし、他の AI 視覚認識技術の研究と比較すると、手話認識の研究開発はより大きな困難と課題に直面しています。手話表現の地域性、複雑さ、多様性により、データの収集とクリーニングの難しさやコストが大幅に増加します。しかし、データのサイズと人工的に設計された機能の欠陥により、多くの従来の研究方法は適応性、一般化、堅牢性の点で非常に制限されています。
(Youtu AI手話翻訳インターフェース) 賈佳雅によると、テンセント・ユートゥが発表したAI手話翻訳機は、聴覚障害者の手話表現習慣に基づいて手話データを収集し、先進的なジェスチャー認識、動作認識、シーケンス翻訳技術を参考にし、独自開発のアルゴリズムにより複雑な手話表現の認識技術の飛躍的進歩を実現したという。他の方法と比較して、Youtu AI 手話翻訳のデータ セットは、約 1,000 の日常的な表現と 900 の一般的な単語をカバーしています。また、データのさらなる分析と要約も行います。現在、最大の中国語手話認識データセットを保有しており、手話表現の全文認識をサポートしています。ユーザーがリアルタイム翻訳を終了して完了したかどうかを直接判断できます。 アプリケーションの探索: 視覚AIがバリアフリー情報の構築を支援 北京聴覚協会の2017年の公開データによると、中国には7,200万人の聴覚障害者がいると推定されており、これは北京の常住人口(2015年時点で約2,200万人)の3倍以上です。私の国では情報アクセシビリティの分野への投資が徐々に増加していますが、国内の聴覚障害者のニーズはまだ満たされていません。 Youtu AI手話翻訳機の導入により、聴覚障害者のコミュニケーション障壁がある程度緩和されるだろう。 賈家亜氏はスピーチで、「今後は、聴覚障害者や手話使用者との密接な交流を通じて、公共の場で聴覚障害者により良いサービスを提供し、情報アクセシビリティの構築をより良く支援していきたい」と述べた。次のステップでは、Youtu LabはAI手話翻訳機を最適化およびアップグレードし、日常のサービス窓口や手話教育などのシーンに実装して、聴覚障害者に真の利便性をもたらすことを目指します。 現在、Youtu Labは深セン市情報アクセシビリティ研究協会とAI手話認識共同プロジェクトチームを設立し、手話データ収集、製品アルゴリズムの最適化などの分野で長期的かつ綿密な協力を展開し、聴覚障害者や手話ユーザーとのさらなる接触を通じて、データ容量の拡大、データ仕様の改善を図り、その後の製品とサービスの展開と情報アクセシビリティ構築の推進に努めています。 (ウトゥと深セン情報アクセシビリティ研究協会AI聴覚障害者アクセシビリティ共同プロジェクトチーム) このデジタルエコシステムカンファレンスで展示された Youtu AI 手話翻訳機は、テンセントが情報アクセシビリティを構築するための最初の試みではありません。テンセントは2009年初頭から情報アクセシビリティの検討を始めました。現在までに、QQ、QQ Space、WeChat、Tencent.com、Tencent News、App Store、Penguin FMなど、同社のほとんどの製品は障害を持つユーザー向けに特別に最適化されており、障害を持つ人々にとって情報に優しい社会の構築に取り組んでいます。 2013年、Tencent YoutuチームとモバイルQQは協力してOCRエンジン技術を改良しました。コンピュータービジョンアルゴリズムと自然言語処理機能に基づいて、画像上のテキストを編集可能な構造化テキストに直接変換できるため、視覚障害者がバリアフリーの情報コミュニケーションを実現するのに役立ちます。 デジタルエコシステムカンファレンスのAIサブフォーラムで初公開された異年齢顔認識技術と同様に、Youtu AI手話翻訳機もテンセントの「テクノロジーで善を」実践の重要な現れです。 Youtu Labは今後も「Technology for Good」の理念を掲げ、最先端技術の社会シーンへの応用を推進し、より実践的な問題を効果的に解決していきます。温かみのあるAIを創り、テクノロジーでより大きな社会的価値を生み出しましょう。 |
<<: テンセントブルーアーミー:サイバーセキュリティを守る軍隊
>>: テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表
[[404969]]今日、デジタル化は企業の中核的な競争力となり、何千もの業界がクラウド コンピュー...
人工知能が今日の情報技術分野で最もホットな話題であることは疑いの余地がなく、情報産業を豊かにし、改善...
現在、世界市場におけるクラウド コンピューティングの見通しは明るいですが、いくつかの欠点により将来的...
Krypt の自社クラウド サーバー ブランド「ION」は、頻繁にプロモーション活動を行っています。...
新しいウェブサイトが最短時間でランキングのメリットを最大化する方法こそが、すべての SEO 担当者が...
米国の老舗高防御サーバーベンダーであるSharktechは、現在、4つのコンピュータールームで40コ...
arkecxはどうですか? arkecxの速度はどうですか? arkecxは良いですか? HostC...
VMware と Microsoft のテクノロジを比較する多くの記事では、サーバーとデータセンター...
Youyunは正式に登録された国内のクラウド サーバー マーチャントであり、広東省広州科技有限公司の...
操作とは何ですか?この種の質問は、さまざまなフォーラム、BBS、Baidu Knows、Q&...
Ramnode、それは本当に簡単ではありません、私たちはVDSビジネスの購入にのみ限定して20%割引...
今年5月にAsiaInfo SecurityとLenovoが統合セキュリティソリューションに関する戦...
余額宝の人気により、国内のインターネット金融産業は爆発的に発展し始め、P2Pオンライン融資モデルはイ...
人工知能と機械学習の技術が進歩するにつれ、企業や組織は競争上の優位性を得るためにこれらの機能を活用す...
Flappy Bird は今年 2 月 10 日に開発元によって主要ストアから削除されましたが、その...