テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

テンセントYoutu AI手話翻訳機がテンセントグローバルデジタルエコシステムカンファレンスでデビュー、温かい人工知能を創出

2019年デジタルエコシステムカンファレンスが5月21日から23日まで昆明で開催されました。AIサブフォーラムでは、テンセントYoutuラボの共同ディレクターで優秀な科学者であるJia Jiaya氏が、YoutuのAI手話認識における最近の画期的な成果である、独自開発のアルゴリズムに基づく「Youtu AI手話翻訳機」の発表を共有しました。

賈佳亜氏によると、AI手話翻訳機は手話収集装置として普通のカメラを使用し、バックグラウンド計算には高性能コンピューターを利用している。ユーザーがカメラに向かって手話表現を完了するだけで、翻訳機が結果を素早く計算し、手話をテキストに変換できます。将来的には、空港や民事窓口などの公共の場に導入・実装され、情報化都市の構築に貢献することが期待されます。

(テンセントYoutuラボ共同ディレクター、テンセントの著名な科学者、賈佳雅氏)

AI手話翻訳機:手話認識の「ブラックテクノロジー」を実現する独自開発アルゴリズム

手話認識(SLR)とは、コンピュータアルゴリズムを使用して、手話表現におけるさまざまなジェスチャーや動き、およびこれらのジェスチャーと動きの切り替えを自動的に区別し、最終的に表現された手話をテキストに変換することを指します。しかし、他の AI 視覚認識技術の研究と比較すると、手話認識の研究開発はより大きな困難と課題に直面しています。手話表現の地域性、複雑さ、多様性により、データの収集とクリーニングの難しさやコストが大幅に増加します。しかし、データのサイズと人工的に設計された機能の欠陥により、多くの従来の研究方法は適応性、一般化、堅牢性の点で非常に制限されています。

[[266133]]

(Youtu AI手話翻訳インターフェース)

賈佳雅によると、テンセント・ユートゥが発表したAI手話翻訳機は、聴覚障害者の手話表現習慣に基づいて手話データを収集し、先進的なジェスチャー認識、動作認識、シーケンス翻訳技術を参考にし、独自開発のアルゴリズムにより複雑な手話表現の認識技術の飛躍的進歩を実現したという。他の方法と比較して、Youtu AI 手話翻訳のデータ セットは、約 1,000 の日常的な表現と 900 の一般的な単語をカバーしています。また、データのさらなる分析と要約も行います。現在、最大の中国語手話認識データセットを保有しており、手話表現の全文認識をサポートしています。ユーザーがリアルタイム翻訳を終了して完了したかどうかを直接判断できます。

アプリケーションの探索: 視覚AIがバリアフリー情報の構築を支援

北京聴覚協会の2017年の公開データによると、中国には7,200万人の聴覚障害者がいると推定されており、これは北京の常住人口(2015年時点で約2,200万人)の3倍以上です。私の国では情報アクセシビリティの分野への投資が徐々に増加していますが、国内の聴覚障害者のニーズはまだ満たされていません。 Youtu AI手話翻訳機の導入により、聴覚障害者のコミュニケーション障壁がある程度緩和されるだろう。

賈家亜氏はスピーチで、「今後は、聴覚障害者や手話使用者との密接な交流を通じて、公共の場で聴覚障害者により良いサービスを提供し、情報アクセシビリティの構築をより良く支援していきたい」と述べた。次のステップでは、Youtu LabはAI手話翻訳機を最適化およびアップグレードし、日常のサービス窓口や手話教育などのシーンに実装して、聴覚障害者に真の利便性をもたらすことを目指します。

現在、Youtu Labは深セン市情報アクセシビリティ研究協会とAI手話認識共同プロジェクトチームを設立し、手話データ収集、製品アルゴリズムの最適化などの分野で長期的かつ綿密な協力を展開し、聴覚障害者や手話ユーザーとのさらなる接触を通じて、データ容量の拡大、データ仕様の改善を図り、その後の製品とサービスの展開と情報アクセシビリティ構築の推進に努めています。

(ウトゥと深セン情報アクセシビリティ研究協会AI聴覚障害者アクセシビリティ共同プロジェクトチーム)

このデジタルエコシステムカンファレンスで展示された Youtu AI 手話翻訳機は、テンセントが情報アクセシビリティを構築するための最初の試みではありません。テンセントは2009年初頭から情報アクセシビリティの検討を始めました。現在までに、QQ、QQ Space、WeChat、Tencent.com、Tencent News、App Store、Penguin FMなど、同社のほとんどの製品は障害を持つユーザー向けに特別に最適化されており、障害を持つ人々にとって情報に優しい社会の構築に取り組んでいます。 2013年、Tencent YoutuチームとモバイルQQは協力してOCRエンジン技術を改良しました。コンピュータービジョンアルゴリズムと自然言語処理機能に基づいて、画像上のテキストを編集可能な構造化テキストに直接変換できるため、視覚障害者がバリアフリーの情報コミュニケーションを実現するのに役立ちます。

デジタルエコシステムカンファレンスのAIサブフォーラムで初公開された異年齢顔認識技術と同様に、Youtu AI手話翻訳機もテンセントの「テクノロジーで善を」実践の重要な現れです。 Youtu Labは今後も「Technology for Good」の理念を掲げ、最先端技術の社会シーンへの応用を推進し、より実践的な問題を効果的に解決していきます。温かみのあるAIを創り、テクノロジーでより大きな社会的価値を生み出しましょう。

<<:  テンセントブルーアーミー:サイバーセキュリティを守る軍隊

>>:  テンセントYoutuラボ、テクノロジーの普及促進のためAI+公共福祉成果2件を発表

推薦する

ramnode-2周年/5.8%割引/ニューヨークの新データセンター/Kvmが勝つ

Ramnode は設立から 2 年になります。2 周年を記念して、最高の割引コード TWOYEAR ...

将来の開発においてクラウド コンピューティングの重要性はどこにあるのでしょうか?

クラウド コンピューティングは、単にコンピューティング サービスを提供します。これらのサービスには、...

ウェブサイト分析: XX 秒で簡単に登録できますか?それで次は何ですか?

さまざまなウェブサイトの登録ページで、「登録まであとxx秒」というプロンプトをよく見かけます。スパム...

ブランドマーケティング革新の方法論!

Heytea、Sandunban、Nayukiなど、最近人気が出ている新しい消費者ブランドを数えてみ...

企業向けWeiboマーケティング講座:ファンのめまいに悩まされないために

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスファンのめまいにならない...

TIC 2018 セーフハウスが再び秘密を明かす: 信頼できるブロックチェーンがデータ限定の「循環ゾーン」を構築

信頼できるデータ流通の問題を解決する業界初の製品として、「Safe House」の登場は一時大きな議...

ブランドマーケティング: 0 から 1 までブランドを構築するにはどうすればよいでしょうか?

2018年は起業の黄金時代の終わりを告げる年であり、これからは確固たるブランディングの始まりとなるか...

さまざまな言語でSEO成功の秘訣を議論する

Google は世界最大の検索エンジンです。Google で検索するユーザーの半数以上がさまざまな言...

Dogyun:「香港-KC」データセンターの「Alibaba Cloud」ラインVPSの簡単なレビュー

ご存知のとおり、Alibaba Cloud 香港回線の VPS は、中国本土に直接接続する 3 つの...

ライブストリーミング後半のビジネスモデル

ライブ e コマースは、プロモーション ライブ ブロードキャストとマーケティング ライブ ブロードキ...

A5マーケティングチーム:百度のグリーンキャロットアルゴリズムは警告であると同時にチャンスでもある

「百度を検索すればわかる」、かつては百度の主なプロモーションだったが、今では誰もが知る存在となり、数...

SEOの観点からドメイン名の選び方とそれに応じたテクニックを分析

著者は以前、ウェブサイトでは高品質のコンテンツと安定した外部リンクを持つことに加え、いくつかの細部に...

ipxcore $6.99 512M メモリ KVM/$4 openvz 150G ハードディスク

2003 年に設立された ipxcore は、現在多くのビジネスを展開しています。このビジネスは、H...

【クラウドネイティブ】Kubernetes CRD 詳細解説(カスタムリソース定義)

1. 概要CRD (カスタム リソース定義) 自体は Kubernetes の組み込みリソース タイ...

AI + エッジコンピューティング - エッジ人工知能は本当に存在するのか?

EdgeAI はもはやブループリント段階ではありません。すでに主流として採用され、驚異的な速度で成長...