テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

2019年デジタルエコシステムカンファレンスが5月21日から23日まで昆明で開催されました。AIサブフォーラムでは、テンセントYoutuラボの共同ディレクターで優秀な科学者であるJia Jiaya氏が、YoutuのAI手話認識における最近の画期的な成果である、独自開発のアルゴリズムに基づく「Youtu AI手話翻訳機」の発表を共有しました。

賈佳亜氏によると、AI手話翻訳機は手話収集装置として普通のカメラを使用し、バックグラウンド計算には高性能コンピューターを利用している。ユーザーがカメラに向かって手話表現を完了するだけで、翻訳機が結果を素早く計算し、手話をテキストに変換できます。将来的には、空港や民事窓口などの公共の場に導入・実装され、情報化都市の構築に貢献することが期待されます。

(テンセントYoutuラボ共同ディレクター、テンセントの著名な科学者、賈佳雅氏)

AI手話翻訳機:手話認識の「ブラックテクノロジー」を実現する独自開発アルゴリズム

手話認識(SLR)とは、コンピュータアルゴリズムを使用して、手話表現におけるさまざまなジェスチャーや動き、およびこれらのジェスチャーと動きの切り替えを自動的に区別し、最終的に表現された手話をテキストに変換することを指します。しかし、他の AI 視覚認識技術の研究と比較すると、手話認識の研究開発はより大きな困難と課題に直面しています。手話表現の地域性、複雑さ、多様性により、データの収集とクリーニングの難しさやコストが大幅に増加します。しかし、データのサイズと人工的に設計された機能の欠陥により、多くの従来の研究方法は適応性、一般化、堅牢性の点で非常に制限されています。

[[266133]]

(Youtu AI手話翻訳インターフェース)

賈佳雅によると、テンセント・ユートゥが発表したAI手話翻訳機は、聴覚障害者の手話表現習慣に基づいて手話データを収集し、先進的なジェスチャー認識、動作認識、シーケンス翻訳技術を参考にし、独自開発のアルゴリズムにより複雑な手話表現の認識技術の飛躍的進歩を実現したという。他の方法と比較して、Youtu AI 手話翻訳のデータ セットは、約 1,000 の日常的な表現と 900 の一般的な単語をカバーしています。また、データのさらなる分析と要約も行います。現在、最大の中国語手話認識データセットを保有しており、手話表現の全文認識をサポートしています。ユーザーがリアルタイム翻訳を終了して完了したかどうかを直接判断できます。

アプリケーションの探索: 視覚AIがバリアフリー情報の構築を支援

北京聴覚協会の2017年の公開データによると、中国には7,200万人の聴覚障害者がいると推定されており、これは北京の常住人口(2015年時点で約2,200万人)の3倍以上です。私の国では情報アクセシビリティの分野への投資が徐々に増加していますが、国内の聴覚障害者のニーズはまだ満たされていません。 Youtu AI手話翻訳機の導入により、聴覚障害者のコミュニケーション障壁がある程度緩和されるだろう。

賈家亜氏はスピーチで、「今後は、聴覚障害者や手話使用者との密接な交流を通じて、公共の場で聴覚障害者により良いサービスを提供し、情報アクセシビリティの構築をより良く支援していきたい」と述べた。次のステップでは、Youtu LabはAI手話翻訳機を最適化およびアップグレードし、日常のサービス窓口や手話教育などのシーンに実装して、聴覚障害者に真の利便性をもたらすことを目指します。

現在、Youtu Labは深セン市情報アクセシビリティ研究協会とAI手話認識共同プロジェクトチームを設立し、手話データ収集、製品アルゴリズムの最適化などの分野で長期的かつ綿密な協力を展開し、聴覚障害者や手話ユーザーとのさらなる接触を通じて、データ容量の拡大、データ仕様の改善を図り、その後の製品とサービスの展開と情報アクセシビリティ構築の推進に努めています。

(ウトゥと深セン情報アクセシビリティ研究協会AI聴覚障害者アクセシビリティ共同プロジェクトチーム)

このデジタルエコシステムカンファレンスで展示された Youtu AI 手話翻訳機は、テンセントが情報アクセシビリティを構築するための最初の試みではありません。テンセントは2009年初頭から情報アクセシビリティの検討を始めました。現在までに、QQ、QQ Space、WeChat、Tencent.com、Tencent News、App Store、Penguin FMなど、同社のほとんどの製品は障害を持つユーザー向けに特別に最適化されており、障害を持つ人々にとって情報に優しい社会の構築に取り組んでいます。 2013年、Tencent YoutuチームとモバイルQQは協力してOCRエンジン技術を改良しました。コンピュータービジョンアルゴリズムと自然言語処理機能に基づいて、画像上のテキストを編集可能な構造化テキストに直接変換できるため、視覚障害者がバリアフリーの情報コミュニケーションを実現するのに役立ちます。

デジタルエコシステムカンファレンスのAIサブフォーラムで初公開された異年齢顔認識技術と同様に、Youtu AI手話翻訳機もテンセントの「テクノロジーで善を」実践の重要な現れです。 Youtu Labは今後も「Technology for Good」の理念を掲げ、最先端技術の社会シーンへの応用を推進し、より実践的な問題を効果的に解決していきます。温かみのあるAIを創り、テクノロジーでより大きな社会的価値を生み出しましょう。

<<:  テンセントブルーアーミー:サイバーセキュリティを守る軍隊

>>:  テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表

推薦する

Baidu の Web ページ品質に関するホワイト ペーパーのサブテキストを解釈する

少し前に、Baidu のトラフィックのシェアが大幅に減少し、360 のトラフィックのシェアが大幅に増...

話題のインターネット クレジットに神経を逆なでされているのは誰でしょうか?

オンラインクレジットの発展は、ほとんどの人が予想した通りであり、市場の熱狂を経験した後、業界の再編が...

gcorelabs: 29 の VPS データ センター、33 の独立サーバー データ センター、CDN\GPU サーバーなど。

gcorelabs は、2011 年に設立されたルクセンブルクのホスティング会社です。主な事業は、V...

コピーから学ぶ教訓: 「中国へのコピー」モデルは中国でどれくらい続くのか?

C2Cは、李開復教授とイノベーションワークスの強力な推進により、突然人気が出ました。では、C2Cモデ...

メール: MXroute、ブラックフライデー先行販売、年間 25 ドル、2 年間 45 ドル、3 年間 65 ドル

有料メールサービスを主に提供しているmxrouteは2009年に設立され、海外の格安有料メールサービ...

クラウドのコンプライアンス: クラウド コンプライアンスの落とし穴を回避する

最近の調査によると、組織の 4 分の 1 以上が今後 1 ~ 2 年以内にすべての IT インフラス...

2020年のクラウドコンピューティングの展望: マルチクラウド管理がさらに高レベルへ

過去 1 年間、ハイブリッド クラウドとマルチ クラウドが話題となってきました。サービスを提供するた...

SKYCC 統合マーケティング ソフトウェア: 通常のマーケティング ソフトウェアよりも多くの補助ツール

マーケティング ソフトウェアなどのツールは、企業のオンライン マーケティングの時間を節約し、効率を向...

動画サイトは、単独のポーターではなく、オリジナルのプログラムを推奨しています

現在では、おなじみの iQiyi、Xunlei Kankan、Youku、Tudou など、動画サイ...

地域不動産ウェブサイトの3つの運用リスクの簡単な分析

地方不動産ネットワークの運営ターゲットは非常に明確で、つまり、住宅を購入して装飾する準備をしている一...

servarica-$7/Xen/2.5g メモリ/25SSD/1T トラフィック/G ポート/カナダ

Servarica は 2010 年に設立され、カナダに登録されています。データ センターもカナダに...

より良く、より安く:価値を犠牲にせずにクラウドコストを削減する 5 つの方法

企業は、どこから始めればよいかを知っていれば、クラウド プロジェクトで大幅なコスト削減を実現できる場...

Baidu Green Radish 2.0 リリース後の新規サイトの SEO 方法

多くの新規参入者の心の中では、SEO はオンライン プロモーションであり、オンライン プロモーション...

百度の有名人検索の刷新後のユーザー体験の簡単な分析

今日、百度で有名人を検索したところ、百度がユーザー体験を向上させるために検索結果に新たな改善を加えた...