アリババが知識蒸留法を革新、その論文がトップカンファレンスCVPR 2022の口頭発表に選出

アリババが知識蒸留法を革新、その論文がトップカンファレンスCVPR 2022の口頭発表に選出

6月23日、アリババDAMOアカデミーの自動運転実験室は知識蒸留法を革新し、複数のコンピュータービジョンベンチマークテストでアルゴリズムのパフォーマンスを大幅に向上させ、業界の最高の方法を上回りました。関連論文はトップカンファレンスCVPR2022に口頭発表(Oral)として収録されており、この技術はDAMOアカデミーの自動運転アルゴリズムライブラリに統合されており、将来的にはターミナル物流無人車両「小曼路」や自動運転トラック「大曼路」への応用が期待されている。

知識蒸留とは、トレーニング済みの大規模モデル (教師モデル) からトレーニング対象の小規模モデル (生徒モデル) に知識を「蒸留」し、小規模モデルが大規模モデルと同等の一般化機能を獲得できるようにするモデル圧縮/モデルトレーニング手法です。大規模モデルはサイズが大きく、展開コストが高額になることが多いのに対し、小規模モデルは柔軟性が高くコンパクトで、コンピューティング リソースの消費を最小限に抑えることができます。

CVPR 2022公式サイトからの論文共有

知識の蒸留は、産業界と学界で注目されている研究テーマです。 DAMO アカデミーの論文「ターゲット認識型トランスフォーマーによる知識蒸留」では、これまでの知識蒸留手法では、主に教師モデルの特徴を 1 対 1 の空間マッチング方式で生徒モデルに抽出していたことが指摘されています。しかし、構造上の違いにより、同じ空間位置にある大規模モデルと小規模モデルの意味情報は通常異なり、1対1蒸留法の基本的な仮定が大きく弱まります。

この論文では、教師モデル特徴の各ピクセルを生徒モデル特徴のすべての空間位置に抽出し、パラメータ相関を通じて生徒特徴と教師特徴の表現コンポーネントに条件付けられた意味距離を測定し、この相関をモデル化する、新しいトランスフォーマーベースの 1 対多空間マッチング方法を提案します。

新しい方法は、ImageNet、Pascal VOC、COCOS-tuff10k などのベンチマークで優れたパフォーマンスを発揮します。たとえば、同じ学生モデル (tiny ResNet18) に基づく ImageNet データセットの画像分類タスクでは、新しい方法によりモデルのトップ 1 精度が 70.04% から 72.41% に向上しました。これは、以前の最適蒸留方法の 71.61% よりも大幅に高い値です。 ; COCO-Stuff10k のセマンティック セグメンテーション タスクでは、新しい方法により mobilenetv2 構造の mIoU が 1.75% 向上します。

DAMOアカデミーが開発した無人物流車両「小曼路」は1000万件以上の注文を配達した

知識蒸留法は、知識転送、半教師あり学習、コンピューター ビジョンなどの下流アルゴリズムで広く使用されています。自動運転技術チームは、オンライン モデルのパフォーマンスを向上させることに注力しており、これにより小規模なモデルでも大きな役割を果たせるようになります。論文著者の于凱成氏は「自動運転は膨大な量の画像や点群情報を毎日処理するスーパーAIシステムだ。アルゴリズムの性能は端末製品の知能化、安全性、信頼性に関係しており、産業実践が技術革新を牽引していると言える」と述べた。

DAMOアカデミーが開発したレベル4自動運転製品「小曼路」は現在、500台以上の車両に導入され、学校やコミュニティなどの末端の場面で1,000万件以上の配送注文が行われているという。 DAMOアカデミーは、幹線物流用無人トラック「ビッグドンキー」の研究開発を開始しました。

<<:  中間レビュー: 2022 年に注目を集める Kubernetes スタートアップ 10 社

>>:  マルチクラウドモデルは万能薬ではない

推薦する

ランキングアルゴリズムコンテンツの90%は4つの要素で決まる

私の意見 - 4つの要素がランキングアルゴリズムの90%を決定しますランキングのために検索マーケティ...

racknerd: 米国クラスター VPS、年間 60 ドル、5 つの IP、1.5G メモリ/1 コア/20g SSD/3T トラフィック/1Gbps 帯域幅、6 つのオプション データ センター

実際、racknerd は、シアトル、ダラス、シカゴ、アトランタ、ニューヨーク、アッシュバーンの 6...

伝統的な企業は電子商取引で行き詰まっている:制度上の欠陥と認識が足かせとなる

[伝統的な企業は電子商取引に参入する際に固有の利点を持っているが、逆に制度上の欠陥や個人の認識が伝統...

ウェブマスターは逆境の中でどのように自分を励ますことができるでしょうか?

朝、鶏が鳴く頃には、すでに記事を書くために起きているかもしれません。夜になっても、まだ外部リンクを投...

北京市衛生監督局:医療ウェブサイトに「中国」という名称をつけることは許可されない

北京時報(李秋萌記者)記者は昨日、北京市衛生監督管理研究所から、同市がインターネット上の医療・健康情...

webcare360: ウクライナ、1G 帯域幅、無制限トラフィック、苦情防止サーバー/著作権を無視

苦情対策サーバー事業を専門とする民間企業「webcare360」は、2009年1月に「セントクリスト...

コミュニケーションとチャネルの5つの側面から知乎と鑑書の違いを分析します。

知乎と建書は全く違うようです。最も明らかな違いは、知乎はエリートでいっぱいですが、建書は草の根の執筆...

エッジコンピューティングのユースケースと例トップ10

企業や消費者がより多くのデバイスをインターネットに接続するとともに、超高速 5G ネットワーク サー...

ウェブサイトナビゲーション開発の分析: どのようなナビゲーションウェブサイトが必要ですか?

1. ナビゲーションウェブサイトとは何ですか?ナビゲーションウェブサイトはURLナビゲーションとも呼...

記事コンテンツ最適化の基本原則

1つ。キーワードの密度に対処する: たとえば、記事内に価値のあるキーワードが複数回繰り返される場合が...

#11.11# dogyun: クラウドサーバーの最適化された全13ラインが30%オフ、独立サーバーは月額100元オフ、香港特別価格クラウドは年間168元まで安くなる

Dogyun(犬雲)はダブル11プロモーションを実施しました。すべてのエラスティッククラウドサーバー...

華雲データは青島ビッグデータ開発促進協会の執行役員に昇進した

[[265286]] 2019年5月10日、青島市ビッグデータ開発推進協会第17回会員大会第3回会議...

夕方のピーク時のhosteonsの最新Ryzen 9 3900+DDR4+NVMeシリーズVPSの簡単なレビュー

AMD の人気が高まるにつれ、ますます多くの VPS ベンダーが AMD プラットフォームを導入し、...