アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

先日、世界最高峰のコンピュータービジョンカンファレンスであるCVPR 2020が主要なチャレンジの結果を発表しました。アリババは4つの大会で世界選手権に優勝した。その中で、最も難しかったDAVISチャレンジにおいて、アリババは映像ターゲットの位置を正確に予測できる手法を提案し、80点以上の得点で初めて1位を獲得した。

CVPR は AI 分野における最大のカンファレンスであり、コンピューター ビジョン分野の「オスカー賞」として知られています。コンピューター ビジョンの分野における将来を見据えた学術研究と産業アプリケーションを取り上げます。会議の研究結果は、ビジュアル AI 分野の研究動向を反映しています。ビデオ会議やライブストリーミングなどのアプリケーションがますます普及するにつれて、トップテクノロジー企業の今年の研究成果は、画像からビデオ分野へと徐々に広がり、ビデオ圧縮、ビデオセグメンテーション、3次元ビジョンなどの領域をカバーしています。

画像認識とは異なり、AI がビデオを分析して理解するための技術的なハードルは高くなります。長い間、ビデオ AI 技術の研究において業界で大きな進歩が見られることはほとんどありませんでした。 CVPR カンファレンスで最も難しい競技の 1 つである DAVIS (Densely Annotated Video Segmentation) を例に挙げてみましょう。このコンテストでは、参加チームは複雑なビデオ内の急速な動き、外観の変化、オブジェクトの遮蔽などの情報を正確に処理する必要があります。過去数年間、世界トップクラスのテクノロジーがこの競争で80点以上を獲得したことは一度もありません。

アリババが参加した4つのコンテストはいずれもビデオ技術分野のものだと報じられている。デイビスチャレンジでは、アリ選手が初の躍進を遂げ、昨年の1位より7.4ポイント高い84.1点で優勝した。

Alibaba AIはDAVISコンペティションで84.1点を獲得し、優勝した。

公開情報によると、アリババは従来のSTM方式における時間的順序の欠如というボトルネックを打破する新しい空間制約方式を提供し、システムがビデオの前のフレームに基づいて次のフレームの対象オブジェクトの位置を予測できるようにしています。さらに、アリババはセマンティックセグメンテーションにおいて洗練されたセグメンテーション微調整モジュールも導入し、セグメンテーションのレベルを大幅に向上させました。最後に、動的ターゲットの輪郭境界が正確に識別され、背景から分離されて、ピクセルレベルのターゲットセグメンテーションが実現されます。

Alibaba AI は、ビデオの前のフレームに基づいて、次のフレームの対象オブジェクトの位置を正確に予測できます。

業界関係者は一般的に、ビデオセグメンテーション技術がオンライン会議、ライブストリーミング、自動運転、映画やテレビ番組の制作などのシナリオの標準になると考えています。たとえば、ライブ放送のシナリオでは、Alibaba AI アルゴリズムを使用して 1 秒で背景を置き換えることができます。自動運転では、ビデオセグメンテーションは自動運転システムが障害物を識別するための重要な技術でもあります。

アリババは4つのコンテストで優勝したほか、自動運転分野の研究成果を含む17本の論文がCVPR 2020に選ばれたと報じられている。本論文では、3D物体検出の精度と速度の両方を初めて実現し、自動運転システムの安全性能を効果的に向上させる汎用的で高性能な自動運転検出器を提案しています。

現在、アリババのビジュアルAI技術は、世界で大規模な実装を実現する上で先頭に立っています。例えば、この技術は、City Brain、Pailitao、Youku Video など、Alibaba グループの内部ビジネス シナリオで大規模に使用されています。アリババのCT画像AIは、世界中の600以上の医療機関にサービスを提供しており、流行期間中に50万件以上の症例の臨床診断を完了した。

<<:  クラウドコンピューティング: 5G と IoT の未来

>>:  ファーウェイの石耀宏氏:産業のアップグレードの重要な10年、ファーウェイのクラウドとコンピューティングは企業の追い越し達成を支援する

推薦する

重慶:今年上半期に合計112の違法ウェブサイトが禁止され、閉鎖された

今年に入ってから、市は30以上の違法出版物生産・販売所を解体し、ポルノ出版物6万部以上、各種の著作権...

クリスマス: greengeeks-35% オフ/cpanel パネル/無制限の仮想ホスティング/無料ドメイン名/純粋な SSD

2004 年に設立されたアメリカのホスティング会社 greengeeks は、クリスマスに仮想ホステ...

過去3か月間のウェブサイト最適化の学習経験についてお話しします

昨年11月に卒業後、ウェブサイト構築会社にインターンとして入社しました。当初はウェブサイトの最適化に...

クラウド時代のインターネットジャンル

01シリコンバレーのインターネットの「先進的なアイデア」は、かつての主導的地位を失いつつある。 Pa...

Vaicdn: クラウドサーバー20%割引、「深セン-香港」専用回線、Huawei高帯域幅、Alibaba高帯域幅、「デジタル通貨」決済

vaicdnはHuawei Cloudの1級認定ディーラーであり、仮想通貨による支払いを受け付けてい...

ウェブサイトのユーザー エクスペリエンス: 「自然な」意思決定エクスペリエンスを実現する方法

WeChatの張小龍氏のユーザーエクスペリエンスに関するQ&A: ユーザーエクスペリエンスの...

vpsfast-10% 割引コード/$4.5/KVM/VPS/512M メモリ/35 オプションのコンピュータ ルーム/Windows

日本の格安 VPS、韓国の格安 VPS、シンガポールの格安 VPS、香港の格安 VPS、台湾の格安 ...

JVMは難しいですか?あるいは、この記事を読んだばかりかもしれません。

コンセプト仮想マシン: 完全なハードウェア システム機能をシミュレートし、完全に分離された環境でソフ...

ウェブサイトが検索エンジンにインデックスされないようにする 7 つの要因

ウェブサイトの最適化を行ったすべての SEO 担当者にとって、新しいサイトか古いサイトかに関係なく、...

サンフォーとファーウェイがクラウドベースの未来に向けて協力

我が国の「新インフラ」戦略が加速期に入るにつれ、クラウドコンピューティングは新技術インフラの一部とし...

Linodeはどうですか?インドネシアのジャカルタデータセンターのクラウドサーバーの評価

LinodeはAkamaiに買収されて以降、インドネシアのクラウドサーバー事業を運営するため、南アジ...

ウェブマスターブログの役割とウェブマスターブログが時代遅れかどうかについての簡単な議論

私はウェブマスターとして2年間働いています。以前、当初の計画に従って個人ブログを作成する予定でしたが...

あなたのウェブサイトは訪問者を必要としていますか、それとも訪問者があなたのウェブサイトを必要としていますか?

ウェブマスターとして、ウェブサイトをリーダーに、訪問者を従業員に例えることもできます。では、誰が誰を...

最大 VPS - 8.5 ドル/年/KVM/64 MB メモリ/5 GB ハードディスク/56 GB トラフィック/G ポート

Maximumvps は新年を前に特別プロモーションを発表しました。64M メモリの KVM アドレ...