アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

アリババはAI分野で4つの「オスカー」賞を受賞した。 AIはビデオターゲットの位置を正確に予測できる

先日、世界最高峰のコンピュータービジョンカンファレンスであるCVPR 2020が主要なチャレンジの結果を発表しました。アリババは4つの大会で世界選手権に優勝した。その中で、最も難しかったDAVISチャレンジにおいて、アリババは映像ターゲットの位置を正確に予測できる手法を提案し、80点以上の得点で初めて1位を獲得した。

CVPR は AI 分野における最大のカンファレンスであり、コンピューター ビジョン分野の「オスカー賞」として知られています。コンピューター ビジョンの分野における将来を見据えた学術研究と産業アプリケーションを取り上げます。会議の研究結果は、ビジュアル AI 分野の研究動向を反映しています。ビデオ会議やライブストリーミングなどのアプリケーションがますます普及するにつれて、トップテクノロジー企業の今年の研究成果は、画像からビデオ分野へと徐々に広がり、ビデオ圧縮、ビデオセグメンテーション、3次元ビジョンなどの領域をカバーしています。

画像認識とは異なり、AI がビデオを分析して理解するための技術的なハードルは高くなります。長い間、ビデオ AI 技術の研究において業界で大きな進歩が見られることはほとんどありませんでした。 CVPR カンファレンスで最も難しい競技の 1 つである DAVIS (Densely Annotated Video Segmentation) を例に挙げてみましょう。このコンテストでは、参加チームは複雑なビデオ内の急速な動き、外観の変化、オブジェクトの遮蔽などの情報を正確に処理する必要があります。過去数年間、世界トップクラスのテクノロジーがこの競争で80点以上を獲得したことは一度もありません。

アリババが参加した4つのコンテストはいずれもビデオ技術分野のものだと報じられている。デイビスチャレンジでは、アリ選手が初の躍進を遂げ、昨年の1位より7.4ポイント高い84.1点で優勝した。

Alibaba AIはDAVISコンペティションで84.1点を獲得し、優勝した。

公開情報によると、アリババは従来のSTM方式における時間的順序の欠如というボトルネックを打破する新しい空間制約方式を提供し、システムがビデオの前のフレームに基づいて次のフレームの対象オブジェクトの位置を予測できるようにしています。さらに、アリババはセマンティックセグメンテーションにおいて洗練されたセグメンテーション微調整モジュールも導入し、セグメンテーションのレベルを大幅に向上させました。最後に、動的ターゲットの輪郭境界が正確に識別され、背景から分離されて、ピクセルレベルのターゲットセグメンテーションが実現されます。

Alibaba AI は、ビデオの前のフレームに基づいて、次のフレームの対象オブジェクトの位置を正確に予測できます。

業界関係者は一般的に、ビデオセグメンテーション技術がオンライン会議、ライブストリーミング、自動運転、映画やテレビ番組の制作などのシナリオの標準になると考えています。たとえば、ライブ放送のシナリオでは、Alibaba AI アルゴリズムを使用して 1 秒で背景を置き換えることができます。自動運転では、ビデオセグメンテーションは自動運転システムが障害物を識別するための重要な技術でもあります。

アリババは4つのコンテストで優勝したほか、自動運転分野の研究成果を含む17本の論文がCVPR 2020に選ばれたと報じられている。本論文では、3D物体検出の精度と速度の両方を初めて実現し、自動運転システムの安全性能を効果的に向上させる汎用的で高性能な自動運転検出器を提案しています。

現在、アリババのビジュアルAI技術は、世界で大規模な実装を実現する上で先頭に立っています。例えば、この技術は、City Brain、Pailitao、Youku Video など、Alibaba グループの内部ビジネス シナリオで大規模に使用されています。アリババのCT画像AIは、世界中の600以上の医療機関にサービスを提供しており、流行期間中に50万件以上の症例の臨床診断を完了した。

<<:  クラウドコンピューティング: 5G と IoT の未来

>>:  ファーウェイの石耀宏氏:産業のアップグレードの重要な10年、ファーウェイのクラウドとコンピューティングは企業の追い越し達成を支援する

推薦する

ChinaCache: エッジコンピューティング - CDN アップグレードの新しいシナリオ

過去 2 年間で、エッジ コンピューティングは業界の新たな焦点となりました。さまざまな業界で AI ...

ハーブティーの戦いで、王老吉が佳多宝を倒すために使った最も強力な技は何でしたか?

月収10万元の起業の夢を実現するミニプログラム起業支援プラン要約:佳多宝の衰退は、ハーブティー業界や...

ninjahawk-512M メモリ KVM/フェニックスデータセンター/月額 7 ドル

Ninjahawk は、米国ニューヨークに登録されているホスティング プロバイダーです。サーバー構成...

大手ショッピングサイトは動的監視に注力:監視システムは来年完成予定

Dianxin OSはローカライズされたAndroidオペレーティングシステムです最も平凡な日にも、...

Pinterest のこれまでの発展の軌跡と今後のロードマップは何でしょうか?

(TechCrunchからのオリジナル記事、Sina Technologyによる翻訳) Pinter...

ウェブサイトのキーワードの安定したランキングを維持した経験

最近、何人かの友人がフォーラムでランキングを上げる問題について議論しています。実際、盲目的に上昇を追...

ビデオがSKYCC複合マーケティングソフトウェアの運命を変える?

最近のニュース「クリエイティブマーケティングとブルーオーシャン戦略がSKYCCの売れ行きを伸ばす」で...

「100元返還」の金看板に騙された会員は38万人、被害額は1億8千万元に上る

サイバー犯罪対策・写真記者の徐偉 インターンの李春光「一筋の火花が草原に火を放ち、一筋の水が海になる...

2019年デジタル中国指数レポートが発表され、デジタル政府業務がビジネス環境や地域経済に深く関連していることが示されました。

5月21日、2019年テンセントグローバルデジタルエコシステムカンファレンスが開催されました。同会議...

ウェブページを元のウィンドウで開くと閲覧しやすくなりますか、それとも新しいウィンドウで開くと閲覧しやすくなりますか?

ウェブページを新しいウィンドウで開くのが良いのか、それとも現在のページで開くのが良いのか。これはおそ...

中国レンタカー市場の年次総合分析

多くの好材料により、中国のレンタカー市場は急速にパンデミック前の水準に回復し、さらに改善すると予想さ...

Baidu 検索エンジンのウェブサイトインデックスの低下問題を解決する方法

ウェブマスターの友人は皆、検索エンジンが常に更新され、価値のあるページが常に追加され、価値のないペー...

知的財産訴訟トップ10のうち4件のオンライン訴訟の背景

4月17日、「3Q」紛争の第二段階の裁判が広東省高級人民法院で始まった。近年、インターネット上での知...