数千万のデータセンターにクラウドネイティブのスーパーコンピューティングを導入

数千万のデータセンターにクラウドネイティブのスーパーコンピューティングを導入

[51CTO.comより引用]ポストパンデミック時代において、企業はクラウドコンピューティング、ビッグデータ、AI、モノのインターネットなどの新技術を積極的に導入し、デジタル変革のペースを加速させ、ビジネスモデルの革新を促進し、企業が持続可能な発展を維持できるようにしています。企業のデジタル変革のプロセスでは、データセンターの高性能コンピューティング リソースが必要であり、さまざまなビジネスのコンピューティング、ストレージ、ネットワークなどのニーズを満たし、効率を向上させ、IT コストを削減するために、クラウドの弾力性と柔軟性も必要です。

では、データセンターとクラウドをよりうまく組み合わせるにはどうすればよいでしょうか? NVIDIA が最近主催したオンライン メディア コミュニケーション ミーティングで、NVIDIA ネットワーク ビジネス ユニットの Song Qingchun 氏が、この問題についてメディアと詳細な意見交換とコミュニケーションを行いました。今回のメディアコミュニケーションミーティングのテーマは「クラウドネイティブスーパーコンピューティングが数千万のデータセンターに進出」でした。 Song Qingchun 氏は、コンピューティング ネットワーク、3U 統合クラウド ネイティブ アーキテクチャ、ゼロ トラスト クラウド ネイティブという 3 つのトピックについて説明しました。同氏は、現在の環境では、企業はデータセンターの無制限のコンピューティング能力と、高度に安全で高度に分離されたゼロトラストネットワークの両方を必要としていると述べた。クラウドネイティブテクノロジーを利用することで、企業のさまざまなニーズを満たすことができます。

[[440857]]

Song Qingchun、NVIDIA ネットワーク部門

クラウドネイティブでデータセンターにスーパーコンピューティングを導入

ビッグデータ分析や人工知能などの技術の応用には、スーパーコンピューティングのサポートが必要です。しかし、スーパーコンピュータの使用コストが高いため、ほとんどの企業はクラウド コンピューティングの弾力性と柔軟性を必要としています。では、スーパーコンピューティングのパフォーマンスとクラウドの柔軟性を統合し、新しいアーキテクチャでさまざまなビジネスのニーズを満たすにはどうすればよいでしょうか。宋青春氏は、クラウドネイティブのスーパーコンピューティング技術の助けを借りて、スーパーコンピューティング技術を数千世帯のデータセンターに導入できると考えています。したがって、クラウドネイティブは、将来的にコンピューティングパワープラットフォームを提供する開発トレンドになるでしょう。

さまざまなクラウドネイティブデバイスをいかに効率的に接続するかは、NVIDIA が解決に取り組んでいる技術的な課題であり、InfiniBand ネットワークが現時点で最も適切かつ最適なネットワークです。

「InfiniBand は、数万、数十万、さらには数百万のノードに簡単に拡張できるコンピューティング ネットワークです。ソフトウェア定義のアプローチにより、管理も容易になります。」宋青春氏は、InfiniBand ネットワークはクラウドネイティブ アーキテクチャに非常に適していると述べました。このため、NVIDIA は、企業が InfiniBand ネットワークをより適切に適用できるように優れたサポートを提供する Quantum-2 プラットフォームを発表しました。

報道によると、NVIDIA Quantum-2 プラットフォームには、Quantum-2 スイッチ、CONNECTX-7 InfiniBand ネットワーク カード、BlueField-3 ベースの InfiniBand DPU という 3 つの非常に重要な製品があります。これら 3 つの製品には、マルチテナント、パフォーマンス分離、輻輳制御、超高精度タイマーなどの主要機能があります。

宋青春氏は記者団に対し、Quantum-2はコンピューティングが可能なネットワークであり、データがどこにあってもコンピューティングを真に実現し、スーパーコンピューティングやクラウドネイティブのネットワークニーズを満たすと語った。 Quantum-2は、AIビジネスに不可欠な技術であるGPU Direct RDMAを実装し、特定のトラフィックをプログラムして高速化するPDA(Programmable Datapath Acclerator)を追加するだけでなく、さまざまな通信モデルを具体的に最適化して、All-to-All通信時の通信効率を向上させます。

Microsoft の AZURE パブリック クラウドでのテスト結果では、InfiniBand の動的ルーティングと輻輳制御テクノロジの使用により、クラウドのパフォーマンスが確保され、さまざまなサービスが互いに影響を及ぼさないように分離され、ベアメタル パフォーマンスが達成されることが示されています。

3U統合クラウドネイティブアーキテクチャは無制限のコンピューティングリソースを提供します

DPU などの専用チップのサポートにより、ネットワークに新たな命が吹き込まれました。

NVIDIA の 3U 統合クラウドネイティブ アーキテクチャについて話す際、Song Qingchun 氏はまず NVIDIA DPU 製品を紹介しました。同氏は、DPUの登場により、データセンターインフラストラクチャの加速能力不足の問題が補われ、DPU、GPU、CPUの新しい3U統合データセンターアーキテクチャが実現され、データセンターが新たなコンピューティングユニットとなり、データセンターのコンピューティングパワーを最適化するための新たなリソースが提供されると述べました。そのため、3U-in-one はデータセンターにとって不可欠なアーキテクチャとなり、DPU、CPU、GPU 間の分業と連携によりデータセンターの最適なパフォーマンスが実現されます。

DPU の登場により、ユーザーはビジネス パフォーマンスを最適化する別の方法を手に入れることができます。 DPU は通信フレームワークを実行し、CPU と GPU は浮動小数点計算を実行します。 DPU は HPC ビジネスにおける通信を高速化し、コンピューティングと通信の重なりを実現します。

Song Qingchun 氏は、一連のデータを使用して、3U 統合クラウドネイティブ アーキテクチャの重要性を詳しく説明しました。 iAlltoall は、HPC アプリケーションや AI 推奨で頻繁に使用される通信モデルです。 DPU と CPU を使用してコンピューティングと通信のオーバーラップを実現することで、iAlltoall のパフォーマンスが 44% 向上します。 iAllgather は、大規模モデルのトレーニングに使用される通信モデルです。 DPU と CPU 間の通信オーバーラップを計算することで、iAllgather のパフォーマンスを 36% 向上できます。

「DPU の登場により、データセンターのインフラストラクチャ アクセラレーション機能が不十分であるという問題が補われ、DPU、GPU、CPU の新しい 3U 統合データセンター アーキテクチャが実現しました。これにより、データセンターが新しいコンピューティング ユニットとなり、コンピューティング リソースを最適化するための想像力をユーザーに提供します。」宋清春は言った。

クラウドネイティブソフトウェアがゼロトラストセキュリティを定義する

リモートワークが新たな常態となった今日、ユーザーはいつでもどこからでも企業の内部データセンターやクラウド内のアプリケーションやデータにアクセスする必要があります。ユビキタスな接続により、ネットワーク セキュリティはますます大きな課題に直面するようになり、ネットワーク セキュリティを確保するためにゼロ トラスト ネットワークが必須となっています。

「従来のネットワーク アーキテクチャでは、問題の発見に 200 日、問題の解決に 70 日かかるとすると、データ センターのセキュリティは非常に低下します。」宋青春氏は、NVIDIA DOCA 1.2 のゼロトラスト セキュリティ フレームワークの助けにより、接続のセキュリティが十分に保証されると述べました。

DOCA 1.2 では、ロード バランサ、DPI、IPS、IDS、次世代ファイアウォールが提供されると報告されています。セキュリティ ソフトウェアを設計するユーザーやセキュリティ ソフトウェアのベンダーは、DOCA API を介して GPU 内のハードウェア アクセラレーション エンジンを直接呼び出して、データ センターのセキュリティを強化することができます。

実際、今年の GTC では、Huang Renxun 氏が Morpheus セキュリティ フレームワークに関する特別講演を行いました。 Morpheus は、悪意のある攻撃を特定するために従来のセキュリティ コンサルタントに頼ったり、限定的なセキュリティ防御のために他のセキュリティ固有のモデルに頼ったりするのではなく、AI を使用して Morpheus を通じてセキュリティ防御を実行するという、将来のデータ センター向けの新しいアイデアを提供します。 AI ディープラーニングを使用すると、データセンターに包括的な保護が提供され、データセンターは悪意のある動作を自動的に検出し、ネットワークが攻撃されるのを防ぐ対策を講じることができます。

報道によると、NVIDIA Ethernet と InfiniBand ネットワークはいずれも Morpheus と統合されており、特に InfiniBand ネットワークの UFM Cyber​​-AI は Morpheus と組み合わせることで、ネットワーク内の異常な動作を識別して処理するだけでなく、将来のネットワークで発生する可能性のある異常な状況を推測し、自己予防保護を実行することもできるとのことです。

宋青春氏は、NVIDIA Morpheus のゼロ教師あり自己学習フレームワークの助けを借りて、テレメトリ データの処理速度を 600 倍高速化し、100 万、あるいは数千万以上のモデルを生成し、データ センターと連携してデータ センターの異常監視と処理を実現できると述べました。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  VMware とパートナーはクラウドへの移行を簡素化し、共同で企業のデジタル変革を支援

>>:  5Gとエッジコンピューティングのメリットとセキュリティ上の課題

推薦する

割引: domain.com - クリスマスセール/ウェブホスティング 50% オフ

EIG による domain.com のクリスマス プロモーション: すべての仮想ホストが 50% ...

JD.comの子会社MiniTiaoは、同社が賃金を滞納していることを明らかにし、親会社を公に非難した。

上場を控えたJD.comは、Yixunとの統合危機に直面したばかりだ。その後すぐに、主に日本と韓国の...

政府のクラウドは伝染病の予防と制御に役立ち、クラウドベースの監視と信頼のメカニズムがより重要になる

2020年の初め、新型コロナウイルス感染症の流行が拡大し、人々の日常生活、仕事、学習も大きな影響を受...

360グループバイイングは新製品計画を立案しており、事業のアップグレードが疑われている

12月7日、情報筋によると、360共同購入ナビゲーションウェブサイトは現在、控えめに新製品をテストし...

分散環境でIDの一意性を確保する方法

[[408786]]この記事はWeChatの公開アカウント「Java Geek Technology...

IBM ハイブリッド クラウド業界エコシステム: 規制の厳しい業界に「ユートピア的な未来」を構築

【ユートピア】オンライン百科事典の定義によれば、「ユートピア」は「理想郷(理想社会)」とも呼ばれ、理...

Microsoft が Windows Live ブランドを廃止へ: ドメイン名の悲劇?

eName.cnは5月3日、海外メディアの報道によると、Windows 8システムの新バージョンはさ...

サーバーホストはどうですか? 「マイアミ」データセンターのVPSの簡単なレビュー

サーバーホストはどうですか? Serverhost Miami の VPS はいかがでしょうか? S...

SEOは成果を生む必要があります

端午の節句が近づいており、多くの友人がすでにこの素晴らしい休日を楽しむ準備をしていると思います。それ...

ftechはどうですか? ftech ベトナム VPS サーバーの簡単なレビュー。IP で Netflix/spotify\steam\chatgpt などをブロック解除できます。

2011 年に設立されたベトナムのサーバー プロバイダーである ftech.vn は、ベトナムで仮想...

SEO コミュニティへの参加に関する議論

外部リンクの組み込みに関しては、ほとんどの SEO 担当者の目には、組み込まれていて検出できる外部リ...

360 と Baidu は秘密戦争を続けるだろう。モバイル インターネットが新たな戦場となる。

360が検索エンジンを立ち上げて以来、360とBaiduの争いは止まったことがなかった。最近の政府当...

少数のファンを使用して、短期間でトラフィックを 2 倍にするにはどうすればよいでしょうか?

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス1. 核分裂の共有に関す...

マイクロソフト、人工知能をベースにした2つのクラウドツールのプレビューを開始

これらのサービスは、Microsoft の Azure クラウド プラットフォームの機能を活用してい...

ジュメイ・ユーピンの成功の経営哲学に関する詳細な議論

1日の売上高は5億元に達し、注文数は200万件を超え、ピーク時には1秒あたり1,000件を超える注文...