3D ポイントクラウド認識は安全ですか?ミシガン大学は、深刻な歪みに対処するためにデータセットの堅牢な分析を提案している

3D ポイントクラウド認識は安全ですか?ミシガン大学は、深刻な歪みに対処するためにデータセットの堅牢な分析を提案している

3D ポイント クラウドは、3D 認識技術で広く使用されています。自動運転や医療画像処理など、一部の特殊なアプリケーション領域では、3D ポイントクラウド認識のセキュリティに対する要件が厳しくなることがよくあります。ポイント クラウド セキュリティに関する現在の学術研究は、敵対的攻撃に対する堅牢性に重点を置いています。敵対的な攻撃と比較すると、現実の世界では自然な歪みや摂動の方が一般的です。しかし、3D ポイント クラウドの歪みに対する堅牢性に関する体系的な研究は行われていません。

  • 論文アドレス: https://arxiv.org/abs/2201.12296
  • プロジェクトのホームページ: https://sites.google.com/umich.edu/modelnet40c
  • オープンソース Github: https://github.com/jiachens/ModelNet40-C

最近、ミシガン大学などの研究者らは、点群認識モデルの歪みに対する堅牢性を体系的にテストし、さらに改善するための新しい包括的なデータセット ModelNet40-C を提案しました。 ModelNet40-C には、それぞれ 5 つの異なる重大度レベルを持つ 15 種類の異なるポイント クラウド歪みタイプからの 185,000 個のポイント クラウド データが含まれています。これらのポイント クラウドの歪みは、密度歪み、ノイズ歪み、変換歪みの 3 つのカテゴリに分類されます。

実験では、ModelNet40-C 上の現在の代表的な 3D ポイント クラウド認識モデル (PointNet、PointNet++、DGCNN、PCT など) のエラー率が、下の図 1 に示すように、元の ModelNet40 データセットのエラー率よりも 3 倍以上高いことが示されています。これは、ポイント クラウド ディープ モデル フレームワークが依然として一般的な歪みの影響を非常に受けやすいことを示しています。

図 1. ModelNet40 および ModelNet40-C データセットにおける深層点群認識の代表的なモデルのエラー率。

この調査結果に基づいて、研究ではさらに多数のテストを行い、さまざまなモデル アーキテクチャ、データ拡張、適応方法が歪みの堅牢性に与える影響を調査しました。研究者らは実験結果に基づいて、3D ポイント クラウド認識テクノロジの開発者がより堅牢なモデルとトレーニング スキームを設計するのに役立ついくつかの調査結果をまとめました。たとえば、研究者は、Transformer ベースのポイント クラウド認識アーキテクチャが、モデルの歪みに対する堅牢性を向上させる上で大きな利点があることを発見しました。異なるタイプのデータ拡張戦略は、さまざまな種類の歪みに対して異なる利点を持っています。テスト中の適応型メソッドは、いくつかの非常に深刻な歪みなどに対して優れた堅牢性を備えています。

ModelNet40-Cデータセットの構築

図 2. ModelNet40-C データセットの歪みの種類の図解。

歪みの堅牢性は 2D 画像で広く注目されており、CIFAR-C と ImageNet-C はさまざまな天候、ノイズ、ぼかしをシミュレートして歪みデータセットを構築します。しかし、この研究の研究者たちは、3D ポイント クラウドの歪みは 2D 画像の歪みとは根本的に異なることを発見しました。その理由は、ポイントクラウドのデータ構造がより柔軟で不規則だからです。たとえば、ポイント クラウド内のポイントの数は変更でき、3D ポイント クラウドの位置の変更は、セマンティック情報に簡単に影響を与える可能性があります。研究者らは、ModelNet40-C を構築するための 3 つの原則を提案しました。1) 意味的不変性、2) 歪みの真正性、3) データセットの品質を確保するための歪みの多様性です。

ModelNet40-C の歪みは、密度歪み、ノイズ歪み、変換歪みの 3 つのカテゴリに分類されます。

密度の歪みには、「オクルージョン」、「LiDAR」、「局所的な密度の増加」、「局所的な密度の減少」、「局所的な欠落」の 5 種類があります。これらは、現実のさまざまなセンサーによって生成される点群密度のさまざまな特性をシミュレートします。たとえば、「オクルージョン」は、3D オブジェクトをスキャンするときに角度制限によりセンサーがポイント クラウドの一部しか生成できないことをシミュレートします。

ノイズ歪みには、「均一」、「ガウス」、「インパルス」、「アップサンプル」、および「バックグラウンド」ノイズがあり、実際のセンサーやプログラムの前処理中に生成される避けられないデジタル ノイズとエラーをシミュレートします。

変換歪みには、「回転」、「位置ずれ」、「自由変形」、「ラジアル基底変形」、「逆ラジアル基底変形」が含まれます。最初の 2 つは、ポイント クラウド データを処理し、データを動的に収集する際の歪みをシミュレートし、最後の 3 つは、AR/VR ゲームと生成モデル (GAN) によって生成されるポイント クラウドの歪みを表します。

図 3. ModelNet40-C 上の 6 つのモデルの平均混同行列。

研究者らは、これらの歪みはポイント クラウド アプリケーションでは非常に一般的であり、生成されたデータセットが図 2 に示すように元のセマンティクスを保持することを確認したと説明しています。図 3 は、ModelNet40-C 上の 6 つのモデルの平均混同行列を示しています。対角線上の割合は依然として非常に高く、ModelNet40-C の意味的不変性も相互検証されます。

ModelNet40-Cのベンチマーク結果と分析

ModelNet40-C を構築した後、この研究では、さまざまなモデル アーキテクチャ設計、さまざまなデータ拡張方法、さまざまな適応方法の実験設定を含む多数のベンチマーク テストを実施しました。

さまざまな歪みとモデルアーキテクチャ設計の比較

表 1. 標準トレーニングにおける ModelNet40-C 上のさまざまなモデルのエラー率。

表 1 に示すように、本研究では、PointNet、PointNet++、DGCNN、RSCNN、PCT、SimpleView の 6 つのモデルに対してベンチマーク テストを実施しました。研究者らはいくつかの調査結果をまとめました: 1)「オクルージョン」と「LiDAR」により、点群認識モデルで極めて高いエラー率が引き起こされました。 2) 小さな角度の「回転」は、依然としてポイントクラウド認識のパフォーマンスに大きな影響を与えます。 3) 「バックグラウンド」ノイズと「インパルス」ノイズは、ほとんどのモデルにとって予期せぬ課題となります。

研究者らは、これらの発見はモデル設計にも反映できると結論付けた。 1) PointNet は密度の歪みに対してより堅牢ですが、全体的なパフォーマンスは劣ります。これは、PointNet がグローバルな特徴のみをエンコードし、ローカルな特徴はエンコードしないためであり、これが長い間 PointNet の主な欠点であると考えられてきました。ただし、密度の歪みは局所的な特徴の損失であり、PointNet への影響は限定的ですが、このメカニズムにより、PointNet は他の種類の歪みに対して非常に敏感になります。研究者らは、PointNet の将来の使用ではアプリケーション シナリオを考慮に入れる必要があると提案しています。

2) ボールクエリクラスタリング方法は、「バックグラウンド」および「インパルス」ノイズに対してより堅牢です。これは、ボール クラスタリングでは、kNN クラスタリングに比べて最大クラスタ半径が制限されるためです。この設計により、モデルは遠く離れた外れ値の影響を取り除くことができます。

3) Transformer ベースのポイント クラウド認識モデルは、変換歪みに対してより堅牢です。これは、自己注意メカニズムにより、モデルがより堅牢で包括的なグローバル機能を学習できるようになり、Transformer アーキテクチャによってモデル容量も大きくなり、グローバルな変形歪みに対してより堅牢になるためです。

さまざまなデータ拡張方法の比較

表 2. 標準トレーニングにおける ModelNet40-C 上のさまざまなモデルのエラー率。

表2に示すように、本研究では、PointCutMix-R、PointCutMix-K、PointMixup、RSMix、およびAdversarial Trainingの5つのデータ拡張トレーニング手法を使用しています。研究者らは、次のことを発見しました。1) これらのデータ拡張スキームは、クリーンなデータセットでのモデルパフォーマンスの改善には限界があるものの、ポイントクラウド歪みシナリオでのモデルの堅牢性は大幅に向上しました。 2) すべての歪みタイプに対応できる単一のデータ拡張方式は存在しません。

PointCutMix-R は、異なるカテゴリの 2 つのポイント クラウドをランダムにサンプリングして直接合成するため、ノイズ歪みに対して非常に堅牢です。生成されたポイント クラウドは、既存の 2 つのダウンサンプリングされたポイント クラウドの「オーバーラップ」であり、ダウンサンプリングされた各ポイント クラウドは、残りの半分のノイズ歪みに相当します。したがって、このようなデータ拡張モードは、ノイズ歪みの堅牢性を大幅に向上させることができます。

PointMixup は、2 つの異なるカテゴリのポイント クラウドに対して最小距離ペアリングと「補間」サンプリングを実行するため、変換歪みに対してより優れたパフォーマンスを発揮します。そのため、生成されたポイント クラウドの形状は 2 つのカテゴリの中間になり、変換歪みの全体的な変形に近くなり、変換歪みに対してより堅牢になります。

RSMix は密度歪みに対して堅牢です。 RSMix の全体的な考え方は PointCutMix と似ていますが、厳密に厳密な合成を規定しています。つまり、2 つの異なるカテゴリのポイント クラウドは、サンプリング後も 3D 空間で独立したままであり、「重ね合わせ」はありません。このような合成は、部分的に欠落した 2 つの独立したポイント クラウドに相当するため、密度の歪みに対してより堅牢になります。

さまざまな適応方法の比較

表 3. 標準トレーニングにおける ModelNet40-C 上のさまざまなモデルのエラー率。

この研究は、テスト時間適応型手法をポイントクラウド認識タスクに適用した初めての研究です。研究者らは、BN 法と TENT 法を使用して、モデルのバッチ正規化層のパラメータを更新しました。彼らは次のことを発見しました: 1) 適応型手法はテスト中にモデルの堅牢性を安定的に向上させることができますが、全体的にはデータ拡張ほど効果的ではありません。 2) テスト適応法は、いくつかの難しい歪みタイプに対して予想外にうまく機能します。

たとえば、平均すると、TENT は歪みの種類「オクルージョン」(エラー率 = 47.6%)、「LIDAR」(エラー率 = 54.1%)、「回転」(エラー率 = 19.8%)において最も強力な堅牢性を実現し、最良のデータ拡張方法よりもそれぞれ 6.7%、1.9%、7.9% 優れています。これは、歪みのある状況での点群認識の堅牢性を向上させる適応型手法の大きな可能性を示しています。

研究者らは最終的に、データ拡張において総合的なパフォーマンスが最も優れていた PointCutMix-R と適応型手法 TENT を組み合わせ、Transformer アーキテクチャに基づく PCT モデルが総合的な歪み堅牢性 (エラー率 = 13.9%) において最も優れていることを発見しました。この発見は、モデルの堅牢性におけるTransformerの成功を検証するものであり、これは基本的に、2D画像に対するTransformerに関する以前の研究(Bai、Yutong、et al.、2021)の結論と一致しています。

要約する

この研究では、新しい包括的な 3D ポイント クラウド認識堅牢性分析データセット ModelNet40-C を提案します。研究者らは、物理的な制限、センサーの精度の制限、実際のシーンでの処理によって引き起こされるポイント クラウドの歪みと損傷をシミュレートするために、75 種類の異なる歪みの種類と度合いを提案し、構築しました。 ModelNet40-C には 185,000 個の異なるポイント クラウド データが含まれています。

実験では、ModelNet40-C 上の現在の代表モデルのエラー率は、元の ModelNet40 データセットのエラー率よりも約 3 倍高いことが示されています。この研究では、多数のベンチマークを通じて、ModelNet40-C 上のさまざまなモデル アーキテクチャ、さまざまなデータ拡張戦略、および適応型メソッドのパフォーマンスを実証し、3D ポイント クラウド コミュニティがより堅牢な認識モデルを設計するのに役立つ有用な調査結果をまとめています。今後、ModelNet40-C データセットによって、ポイント クラウド認識の堅牢性に関する研究がさらに加速されることを期待しています。

<<:  この冬季オリンピックのブラックテクノロジーは毛細血管にまで届くほど精巧だ

>>:  企業はどのようにしてクラウド移行を成功させることができるのでしょうか?

推薦する

ウェブサイト最適化事例: ウェブサイトのキーワードをどのように決定すればよいですか? - A5 Webmaster Network

ウェブサイト最適化の事例: ウェブサイトのキーワードをどのように決定すればよいですか? SEO とは...

小規模販売業者の再生への道は販売業者だけのものではない

2013年末以来、タオバオに小規模な販売業者を締め出すよう求める声がますます大きくなっており、最近で...

新しいサイトのスナップショットとソリューションの組み込みに影響する要因の解釈

新しいウェブサイトがオンラインになるたびに、ウェブマスターはこのウェブサイトに非常に失望しています。...

cmivpsはどうですか?香港CN2+BGPシリーズVPSの広帯域化を簡単に評価

cmivps の香港 VPS のデフォルト設定は中国本土最適化ですが、私が使用した多くのネットワーク...

タオバオの技術開発レビュー(第3部):Oracle/Alipay/Wangwang

オラクル/アリペイ/ワンワン  タオバオは個人のウェブサイトとしてはそれほど長い歴史はありません。し...

初心者ウェブマスター向けの簡単な説明: オンラインでの商品コンバージョン率を向上させる方法

今日のインターネット時代の発展は、あらゆるものに急速な変化をもたらしました。インターネット マーケテ...

#RHS-$20/L5420/16G メモリ/1T ハードディスク/5IP/バージニア (米国)

Reliablehostingservices が素晴らしい情報を公開しました。L5420 といくつ...

ウェブサイトの SEO にはどこにも落とし穴がありますか?あなたが求めるエンタープライズネットワークマーケティングツール

インターネットの普及により、ネットワークは生活のあらゆる側面に浸透し、多くの企業がビジネスチャンスを...

効果的なアンカーテキスト外部リンクを見つける方法: フォーラム

一昨日、「外部リンクの最適化の重要性の過去と現在」の共有で、「効果的な外部リンク」という概念について...

電子商取引チャネルの位置付けと収益モデル分析

少し前に、私は Danren Consulting Group が主催する電子商取引ネットワーク マ...

SEOが貧弱で、インターネット全体が貧弱

今日のインターネットの世界では、最も効果的なマーケティングツールとして、SEO は全世界を征服し、世...

Weiboマーケティングを活用して商品を宣伝する方法

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeibo マーケティン...

スマートホストはどうですか?タンパ(フロリダ - 米国 - 北部)データセンターの VPS の簡単なレビュー

Smarthostは、米国フロリダ州の北西海岸のタンパにVPSなどのサービスを展開しています。メキシ...

衣料品ウェブサイト向け検索エンジン最適化ソリューション

これは、当社の衣料品ウェブサイトの状況に基づいて、いくつかの一般的な SEO 手法をまとめたものです...

中国のSEO担当者は言葉遊びだけに留まるべきではない

中国のSEO担当者は言葉遊びだけに留まるべきではない数日前、英語の SEO に取り組んでいるグループ...