DPU: サーバー エコシステムの「ハイジャック」

DPU: サーバー エコシステムの「ハイジャック」

DPU はデータ処理ユニットの略です。 AWS の Nitro をはじめ、クラウド コンピューティング技術や製品で数年前から使用されています (Mellanox の CX-5 などに相当するスマート ネットワーク カード ENA ではないことに注意してください)。ただし、ほとんどのクラウド ベンダーは、独自のクラウド プラットフォームでこれを使用しています。最近、NVIDIA CEO の Jensen Huang 氏による DPU 製品 BlueField-X の紹介と製品発表ビデオが大きな話題を呼んでいます。

ブルーフィールド2 伝説

では、DPU とは何でしょうか?類似デバイスである DPU のいくつかの特性について、以下に説明します。

1) DPU は独自の CPU を備えた完全なボードです。組み込み機器ではMIPSのような低性能CPUではなく、ARMなどのサーバー用と同タイプのCPUが一般的です。さらに、このカードには独立したメモリ、ディスク、ネットワーク カード、構成可能な GPU およびその他の拡張デバイス、および独立した BMC と OS も搭載されています。つまり、物理的な形状を無視すれば小型サーバーです。

2) DPU デバイスが動作している場合、一般的なサーバーに接続された補助デバイスとして有効になり、PCI デバイスを介してホストと情報を交換します。ホスト OS の観点から見ると、DPU デバイスは透過的ですが、それが提供するネットワーク、ストレージ、セキュリティなどの機能は表示されます。

3) DPU デバイスの起動/再起動は、それが属するホストによって異なります。両者の OS は互いに独立していますが、制御情報の伝送とデータ情報のやり取り (PCI インターフェイス経由) が行われます。スマート ネットワーク カードと比較すると、それが属するホスト内で完全に可視および制御可能です。

4) 前述のように、 DPU はスマート NIC またはスマート NIC の拡張バージョンであると考える人が多くいます。個人的にはそうは思いません。一方、DPU はスマート NIC よりも包括的な機能 (ネットワーク機能、ストレージ機能、セキュリティ機能など) を備えています。一方、スマート NIC のドライバーは通常ホストにありますが、DPU にはドライバーはまったく必要ありません。最後に、DPU には独立した CPU と OS がありますが、スマート NIC はドライバー デバイスのみです。したがって、DPU は既存の NIC デバイスの拡張バージョンではなく、まったく新しいソフトウェア定義インフラストラクチャ デバイス (Software-Defined Infrastructure) です。

上記の点から、DPU が提供できる機能は次のようになります。

1) ホストにネットワーク処理機能、ストレージ処理機能、セキュリティ処理機能を提供します。これらの機能は、DPU OS ソフトウェア スタックを使用して実装することも、スマート ネットワーク カードやセキュリティ デバイスを通じてオフロードされたハードウェアを使用して実装し、処理パフォーマンスを向上させることもできます。たとえば、NVIDIA の BlueField-2 は ConnectX-6 を統合して 200G イーサネットまたは IB 処理機能を提供し、仮想スイッチ オフロードを実装します。

2) DPU型デバイスで使用されるCPUは、前述のARMになります。技術的には、X86 などの同等の機能を備えた他の CPU でも可能ですが、製品化の際には、パフォーマンス、消費電力、製品サイズ、ホスト スロットなどの影響を考慮する必要があります。

3) AWS Nitro カードなどの DPU タイプのデバイスもハイパーバイザー機能を提供できるため、BMS および EC2 インスタンスに一貫した製品アーキテクチャと機能が提供されます。これは、BMS 製品の実装にとって特に重要です。詳細については、Alibaba の Shenlong 関連の説明を参照してください。

4) DPU タイプのデバイスは、「異機種」のサーバー エコシステムを独立して構築する機能を提供します。たとえば、X86 サーバーでは、Mellanox (NVIDIA が買収) や NVIDIA の GPU などの多くのネットワーク カードは、X86 マザーボード CPU に直接関連付けることなく、標準の PCI 標準を通じて X86 上で対応する機能を簡単に提供できます。これにより、他のメーカーは、サーバーのホスト CPU 周辺機能を構築するためのチャネルをさらに提供できるようになり、ホスト CPU に縛られたり依存したりすることがなくなり、ホスト CPU メーカーによって設定された「しきい値」を「バイパス」することもできます。

それでは、上記の内容と組み合わせて、DPU の出現が業界に何をもたらすのかを見てみましょう。

1) 技術的には、DPU デバイスをホストに接続することで、ホスト リソースの使用率を最大化できます。 DPU が安価であるため、クラウド コンピューティング シナリオでより多くのホスト CPU を販売できるようになり、より大きな単一の EC2 インスタンスや BMS を提供するためのソリューションも提供されます。ホスト CPU の販売数が増えたということは、ホストの数が増えたのではなく、販売される製品の数が増えたということです。さらに、DPU のスマート ネットワーク カードなどのハードウェア オフロードを使用すると、ネットワーク機能とストレージ機能、および暗号化と復号化のセキュリティ機能が向上します。 DPU デバイスのホストに対する透過性により、侵入後のクラウド コンピューティング ホストの拡散分離機能が向上します。

2) 商業的な観点から、 NVIDIA の DPU を例にとると、NVIDIA 製品のネットワーク カードと GPU 周辺機器は、ホストのマザーボード/オンボードによって制約されなくなりました。これは、前述のように、DPU デバイスが PCI 標準を介して通信し、CPU のコンピューティング パワーを徐々に奪取するためです。つまり、顧客のデータ センター内の既存の X86 デバイスを維持しながら NVIDIA のデバイス機能を追加し、このコンピューティング パワー市場を徐々に侵食し、データ センターにおける NVIDIA の総合的な機能を構築し、最終的にデータ センターにおける「フル スタックのデバイス」という目標を達成できます。たとえば、Intel CPU オンボード ネットワーク カードはこのメーカーのものでなければならないなどの制限を打ち破る。

3) トレンドの観点から見ると、 DPU デバイスはホストをより「インテリジェント」にします。オリジナルのサーバーには通常、管理機能 (BMC) が搭載されていますが、インターフェースの標準化、インターフェースのパフォーマンス、機能の豊富さは常に不十分でした。 DPU デバイスは、データセンター ハードウェア機器の SDN (ネットワーク定義ソフトウェア) と SDS (ネットワーク定義ストレージ) に続く SDC (ネットワーク定義コンピューティング) の最終リンクを実現する方法を提供します。純粋な仮想化コンテンツを備えた元の SDC と比較して、最終的には機能と機器のインテリジェントな管理と制御、つまり前述の SDI 機能を実現します。

4) DPU 機器の登場により、特にクラウド シナリオにおいてデータ センター サーバー機器によって引き起こされるいくつかの問題が解決され、データ センターのインテリジェンスの重要な部分が実現されました。ただし、現時点では、X86 サーバーの CPU ホストが NVIDIA の DPU を使用する場合、CPU のオンボード ネットワーク カードは役に立たなくなり、全体的な機器調達コストと調達プロセスにも影響するため、DPU の選択では市場と顧客の要因を考慮する必要があります。

5) システム全体の運用の観点から、単一ホストの本来の許容障害範囲が、DPU デバイスと CPU ホストを含​​むように拡張されました。どちらかが故障すると、全体的に損害が発生し、信頼性と安定性が低下します。結局のところ、「ただのランチはない」のです。利益を得たいなら、お金を払わなければなりません。唯一の疑問は、この価格が顧客に受け入れられるかどうかだ。

6) DPU は結局のところハードウェア製品です。その研究開発にはCPUだけでなく、ネットワークカード、OSなども含まれるため、DPUをベースにしたいわゆる自主研究開発とサーバー機器そのものとの間に大きな違いはありません。設備のサイズ制限により、製造精度に対する要件がさらに厳しくなります。したがって、DPU の製造はサーバー統合として行うことができます。サーバーベンダーから学べる技術はまだまだたくさんあります。したがって、DPU 型デバイスがすべてスタートアップ企業によって自社開発されている場合、この自社開発という記述の信憑性は当然疑問視されます。

つまり、DPU デバイスはより実用的な機能を提供しており、NVIDIA などのメーカーも製品の位置付けや市場を考慮していますが、「データセンター インフラストラクチャ」という用語は、メーカー自身の目標のためのスローガンとしか見なされておらず、まだ必要ではありません。 DPU市場の観点から見ると、主にクラウドコンピューティングのシナリオで使用され、主要なクラウドコンピューティングメーカーは基本的に独自の設備を自社開発するか、設備の協力とカスタマイズを行っています。 DPU 製品の道のりは、本当に広くはないため、時間をかけて先の道を見極める必要があります。

<<:  マイクロソフト、クラウド環境向けセキュリティ評価アプリケーション「Cloud Katana」をオープンソース化

>>:  2021年上半期のクラウドコンピューティングの振り返り:利益、セキュリティ、政府対応が3つの新たな課題に

推薦する

ウェブマスターは、自分のサイト上のアンカーテキスト内部リンク構築についてどの程度知っていますか?

ウェブサイトのキーワードランキングは、主に強力なアンカーテキストリンクによって達成されます。検索エン...

Googleの海外プロモーションで迷わない方法

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています海外のユー...

火に火を付ける: マーケティング戦略で営業人材を採用する

マーケティング人材の獲得競争は常に熾烈であり、企業のマーケティング部門に限らず、マーケティング ソフ...

クラウド サービス OpenAPI の 7 つの主要な課題: アーキテクトはどのように対処すべきでしょうか?

[[279233]] API は、モジュールまたはサブシステム間の相互作用のためのインターフェース定...

大規模トラフィッククラスター向けコンテンツ運用

前回の記事では、サイトクラスターを構築するための非常に重要な準備、つまり、サイトクラスターを業界内で...

Tuanbao.com が「賃金未払いスキャンダル」に巻き込まれる: 共同購入サイトの変革は避けられない

国内の共同購入サイトの数は2010年8月以降1,000サイトを突破した。非合理的な発展により、201...

Dropboxのユーザー数が1億7500万人に到達、アプリデータネットワークストレージサービスを開始

網易科技報、7月10日、海外メディアの報道によると、ネットワークストレージサービスプロバイダーのDr...

クラウド移行のセキュリティリスクを評価する3つのステップ

この突然かつ予期せぬリモートワークへの移行により、企業はコラボレーションと情報共有の新しい方法を見つ...

gcorelabs: ロシア極東ウラジオストクの月額1.08ユーロのVPSの簡単なレビュー。ただし、モバイルユーザーは使用しないことをお勧めします。

ルクセンブルクの企業 gcorelabs は、中国に近く、比較的高速なロシア極東にウラジオストク デ...

第1回デジタル中国クラウドデータ開発コンテストが終了し、デジタルイノベーションの新たなモデルが開かれた。

[51CTO.comからのオリジナル記事] 現在、COVID-19の流行により、中国のデジタル化は急...

インターネットマーケティングプランの作成方法を学ぶための7つのヒント

あらゆるオンライン マーケティング活動は、事前に計画がなければ実行できません。優れたマーケティング ...

Baiduプロモーションウェブサイトのクリック時の遅いオープン速度からウェブサイトスペースの安定性について議論する

「商品に自信があるなら、百度入札プロモーションをやろう!」これは、ロビン・リーが百度入札商品を位置づ...

良いコード例: Redis に基づく軽量分散バランス消費キュー

[[393103]] 1. 良いコードについての私の意見1. 良いコードとは何か? 『デザインパター...

5つのビッグデータ処理/データ分析/分散ツール

[[241325]] 1. ハドゥープHadoop は、シンプルなプログラミング モデルを使用して、...

高鵬の「地下鉄10回券」は1回しか使えず、交換できるとの回答

最近、Gaopeng.comでグループ購入で「地下鉄記念チケット(10回券)」を購入した一部の消費者...