2019年デジタルエコシステムカンファレンスが5月21日から23日まで昆明で開催されました。AIサブフォーラムでは、テンセントYoutuラボの共同ディレクターで優秀な科学者であるJia Jiaya氏が、YoutuのAI手話認識における最近の画期的な成果である、独自開発のアルゴリズムに基づく「Youtu AI手話翻訳機」の発表を共有しました。 賈佳亜氏によると、AI手話翻訳機は手話収集装置として普通のカメラを使用し、バックグラウンド計算には高性能コンピューターを利用している。ユーザーがカメラに向かって手話表現を完了するだけで、翻訳機が結果を素早く計算し、手話をテキストに変換できます。将来的には、空港や民事窓口などの公共の場に導入・実装され、情報化都市の構築に貢献することが期待されます。 (テンセントYoutuラボ共同ディレクター、テンセントの著名な科学者、賈佳雅氏) AI手話翻訳機:手話認識の「ブラックテクノロジー」を実現する独自開発アルゴリズム 手話認識(SLR)とは、コンピュータアルゴリズムを使用して、手話表現におけるさまざまなジェスチャーや動き、およびこれらのジェスチャーと動きの切り替えを自動的に区別し、最終的に表現された手話をテキストに変換することを指します。しかし、他の AI 視覚認識技術の研究と比較すると、手話認識の研究開発はより大きな困難と課題に直面しています。手話表現の地域性、複雑さ、多様性により、データの収集とクリーニングの難しさやコストが大幅に増加します。しかし、データのサイズと人工的に設計された機能の欠陥により、多くの従来の研究方法は適応性、一般化、堅牢性の点で非常に制限されています。
(Youtu AI手話翻訳インターフェース) 賈佳雅によると、テンセント・ユートゥが発表したAI手話翻訳機は、聴覚障害者の手話表現習慣に基づいて手話データを収集し、先進的なジェスチャー認識、動作認識、シーケンス翻訳技術を参考にし、独自開発のアルゴリズムにより複雑な手話表現の認識技術の飛躍的進歩を実現したという。他の方法と比較して、Youtu AI 手話翻訳のデータ セットは、約 1,000 の日常的な表現と 900 の一般的な単語をカバーしています。また、データのさらなる分析と要約も行います。現在、最大の中国語手話認識データセットを保有しており、手話表現の全文認識をサポートしています。ユーザーがリアルタイム翻訳を終了して完了したかどうかを直接判断できます。 アプリケーションの探索: 視覚AIがバリアフリー情報の構築を支援 北京聴覚協会の2017年の公開データによると、中国には7,200万人の聴覚障害者がいると推定されており、これは北京の常住人口(2015年時点で約2,200万人)の3倍以上です。私の国では情報アクセシビリティの分野への投資が徐々に増加していますが、国内の聴覚障害者のニーズはまだ満たされていません。 Youtu AI手話翻訳機の導入により、聴覚障害者のコミュニケーション障壁がある程度緩和されるだろう。 賈家亜氏はスピーチで、「今後は、聴覚障害者や手話使用者との密接な交流を通じて、公共の場で聴覚障害者により良いサービスを提供し、情報アクセシビリティの構築をより良く支援していきたい」と述べた。次のステップでは、Youtu LabはAI手話翻訳機を最適化およびアップグレードし、日常のサービス窓口や手話教育などのシーンに実装して、聴覚障害者に真の利便性をもたらすことを目指します。 現在、Youtu Labは深セン市情報アクセシビリティ研究協会とAI手話認識共同プロジェクトチームを設立し、手話データ収集、製品アルゴリズムの最適化などの分野で長期的かつ綿密な協力を展開し、聴覚障害者や手話ユーザーとのさらなる接触を通じて、データ容量の拡大、データ仕様の改善を図り、その後の製品とサービスの展開と情報アクセシビリティ構築の推進に努めています。 (ウトゥと深セン情報アクセシビリティ研究協会AI聴覚障害者アクセシビリティ共同プロジェクトチーム) このデジタルエコシステムカンファレンスで展示された Youtu AI 手話翻訳機は、テンセントが情報アクセシビリティを構築するための最初の試みではありません。テンセントは2009年初頭から情報アクセシビリティの検討を始めました。現在までに、QQ、QQ Space、WeChat、Tencent.com、Tencent News、App Store、Penguin FMなど、同社のほとんどの製品は障害を持つユーザー向けに特別に最適化されており、障害を持つ人々にとって情報に優しい社会の構築に取り組んでいます。 2013年、Tencent YoutuチームとモバイルQQは協力してOCRエンジン技術を改良しました。コンピュータービジョンアルゴリズムと自然言語処理機能に基づいて、画像上のテキストを編集可能な構造化テキストに直接変換できるため、視覚障害者がバリアフリーの情報コミュニケーションを実現するのに役立ちます。 デジタルエコシステムカンファレンスのAIサブフォーラムで初公開された異年齢顔認識技術と同様に、Youtu AI手話翻訳機もテンセントの「テクノロジーで善を」実践の重要な現れです。 Youtu Labは今後も「Technology for Good」の理念を掲げ、最先端技術の社会シーンへの応用を推進し、より実践的な問題を効果的に解決していきます。温かみのあるAIを創り、テクノロジーでより大きな社会的価値を生み出しましょう。 |
<<: テンセントブルーアーミー:サイバーセキュリティを守る軍隊
>>: テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表
Torqhost は 2007 年に設立されたホスティング会社で、データ センターはエストニアのタリ...
[[391713]] [51CTO.com クイック翻訳]現在ハイブリッド クラウドを構築する場合、...
定評のあるホスティング プロバイダーである kvmla は、リピーターのユーザー向けに VPS と専...
2006年、YouTubeは中国の未成熟なビデオ業界に美しい神話を描きました。この神話に後押しされて...
Dogyun (Dog Cloud) は、新しい製品ライン「クラシック クラウド サーバー」を発表し...
今朝早く、 WeChatはもう一つの大きな動きを見せ、瞬く間に多くの業界関係者の注目と議論を集めまし...
LBXUは現在、「ダブルイレブンホットセール」イベントを推進しており、同時に、米国から新しく発売され...
3月は養成校の入学者ピーク時期です。この時期にいかにうまく宣伝するかが、各養成ユニットに優秀な学生を...
ftlcloud (Super Cloud) は、香港、中国本土、韓国、米国にデータセンターを持ち、...
Huawei Cloudは現在、バイオテクノロジー、オンライン教育、不動産、モノのインターネット、ビ...
タイトルを読んだ後、多くのウェブマスターは確かにそのような成果を軽視するでしょうが、この SEO の...
1. 背景本番環境での使用では、Elasticsearch では完全一致だけでなく、あいまいなクエリ...
少し前に、私のウェブサイトも含め、多くのウェブサイトがブロックされました。一瞬、誰もが混乱し、何が原...
周知のように、電子商取引の継続的な発展に伴い、オンラインプロモーションの手段とパターンは非常に多くな...
すぐにホームページを検索し、10月上旬と11月上旬のスクリーンショットを比較してくださいヘッダーの元...