1900 年、尊敬を集めるケルビン卿がロンドンのアルベマール ストリートにある王立研究所で講演を行いました。講演のタイトルは「19世紀の熱と光力学理論の雲」でした。ケルビン卿は次のように要約しました。「物理学の建物は 19 世紀に完全に構築されており、物理学者の今後の課題は、それを装飾し、完成させることだけである。」 ケルビン卿は、「建物は完成したが、晴れた空にまだ2つの小さな暗い雲がある」と指摘した。これがケルビン卿が予言した「2つの暗い雲」である。しかし、彼が予想していなかったのは、晴れた空に浮かぶ2つの小さな暗い雲がどんどん大きくなり、巨大な嵐に発展することだった。これら 2 つの暗雲が古典物理学の基盤を破壊し、現代物理学の 2 つの柱である量子力学と相対性理論を確立しました。 現在、X86 上に構築されたクラウド コンピューティング帝国は強固な基盤を持ち、世界中で平和を保っています。しかし、空には小さな暗い雲が 2 つあります。これら 2 つの「小さな暗雲」が、クラウド コンピューティングの将来のアーキテクチャに劇的な変化をもたらすのか、それとも単なる穏やかな出来事なのかは誰にもわかりません。しかし、確かなのは、x86 クラウド コンピューティング帝国に足がかりを得たいと考えているチップ業界の実務家にとって、これら 2 つの暗雲はまれなチャンスになるかもしれないということです。 01 クラウドコンピューティングの夢 2006 年 8 月、サンノゼで Search Engine Strategies (SES) カンファレンスが開催されました。チケットの値段が高かったにもかかわらず、出席者の熱意は衰えなかった。次々と繰り広げられるスピーチからは、業界大手の英知と将来の方向性に対する考えが伝わってきました。その中で、グーグル創業者のシュミット氏が基調講演を行った。このスピーチで彼はクラウドコンピューティングの概念を提案しました。クラウド コンピューティングの導入により、人々は水道、電気、ガスを使用するのと同じようにコンピューティング サービスを利用できるようになります。 今ではクラウドコンピューティングサービスは日常生活でよく使われるようになりましたが、当時はこのコンセプトが提案されると業界で大騒ぎになりました。多くの人がそれは悪い考えだと思った。これは「古いワインを新しいボトルに入れる」というアイデアであり、IBM メインフレームの新しいアプリケーションにすぎないと考える人も多くいます。情報化社会はメインフレーム時代からPC(パーソナルコンピュータ)時代へ、そしてPCからクラウドコンピューティング時代へと進化し、人々に技術的な生まれ変わりの幻想を与えてきました。もし当時セルフメディアがあったとしたら、おそらく次のように書かれていたでしょう。「クラウド コンピューティングは、アーキテクチャの歪みか、それともテクノロジーの衰退か?」 クラウド コンピューティングを建物と見なすと、この建物がどのようなコンピューティング アーキテクチャに基づいて構築されているかについて、メーカーごとに異なる見解を持つことは間違いありません。しかし、当時、RISC サーバー、特に IBM の POWER と SUN の SPARC は野心的で、クラウド コンピューティングの時代にその能力を発揮したいと考えていました。 2006年に開催された国際固体回路会議「ISSCC」において、IBMは5GHzの超高周波を実現したPower6に関する論文を発表しました。今日でも、この指標は時代を先取りしています。 また、2006 年に、Sun は最初の 2 つの UltraSPARC 製品である Sunfire T1000 と Sunfire T2000 をリリースしました。これらの製品の発売は、構築が始まったばかりのクラウド コンピューティング ビルディングの明るい未来と強固な基盤の到来を告げるものでした。同年、Intel も 65 ナノメートル製造プロセスを導入し、新世代の Xeon プロセッサを発売しました。クラウド コンピューティングは、インフラストラクチャ構築の新たなブームをもたらし、x86 と RISC の双方にとって巨大な市場機会を予感させます。 02 ゲーム・オブ・スローンズ 従来の銀行、通信、保険などの業界では、独自のデータセンター (エンタープライズ クラウド) を構築したいと考えています。サーバー需要者として、独自のビジネスを展開するには、サーバー アーキテクチャ、オペレーティング システム、データベースに関する豊富な開発経験を持つチームをサポートする必要がありますが、これは少し非現実的です。そのため、これらの業界ユーザーは、メニューベースでサーバープロバイダー (IBM など) からハードウェアおよびソフトウェア サービスを受け取ります。サーバーメーカーはこれらのハードウェアおよびソフトウェア サービスを提供し、料金を請求します。この論理は非常に明確です。 しかし、新世代のルール定義者である Google、Amazon、そして新星 Alibaba は、オープン アーキテクチャ、コスト、保守性に対して独自のこだわりを持っています。クラウド サービス プロバイダー自体はテクノロジー指向のチームです。パブリック クラウド ベンダーは、アプリケーション需要、システム アーキテクチャ、ソフトウェア テクノロジーの 3 つの機能を習得しています。クラウド サービス プロバイダーは、サーバーの需要者とテクノロジー プロバイダーの両方であり、二重のアイデンティティを持っています。自社のニーズに応じて最適なソフトウェアとハードウェア設備を選択し、ビジネスニーズに応じてデータを移行する必要があります。彼らにとって、クローズドアーキテクチャは本質的に受け入れるのが難しいのです。 たとえば、元のサーバーの製造元はレストランのようなものです。このようなレストランではメニュー注文しか提供できず、従来は銀行(エンタープライズクラウド)などの富裕層顧客は、提供されたメニューに従って注文するだけで済みました。現在、十分な予算がない顧客にも食事サービスを提供できるフードデリバリー会社(パブリッククラウドコンピューティングプロバイダー)が存在します。フードデリバリー会社(パブリッククラウドコンピューティングプロバイダー)は、メニューの料理にあまり満足していないだけでなく、このレストラン(サーバーメーカーのハードウェアとソフトウェア)がカスタマイズした「豚の煮込みスペアリブ」がフードデリバリーの顧客の要件を満たしていない可能性があります。クラウドファクトリーは、よりきめの細かい「豚バラ肉ご飯」を期待しています。サーバーメーカー(レストラン)がカスタマイズできない場合、これらのフードデリバリー会社(クラウドファクトリー)も自分で調理する能力を持ち(フードデリバリーの男性が調理するシーンを想像してください)、顧客のニーズに応じてさまざまな組み合わせの料理をパッケージ化する必要があり、フードデリバリーの男性だけでなく、シェフも必要になり、後に「自家開発豚」のブリーダーに進化しました。 パブリック クラウド企業は、クローズド アーキテクチャ サーバーを除外した独自のビジネスを管理したいと考えています。このため、かつて忠実に RISC を使っていた多くのユーザーは、クラウド コンピューティングを検討する際、IBM POWER などの従来の RISC アーキテクチャ プロセッサではなく、X86 を検討するようになりました。 X86 サーバーはより安価で、よりオープンで、より標準化されており、使いやすいです。 x86 のこれらの利点により、重要でないビジネス ユーザーは x86 をより積極的に受け入れるようになります。 x86 プロセッサは、アーキテクチャ、プロセス テクノロジー、コア数の面で継続的に改善されており、x86 のパフォーマンスは RISC サーバーに追いついています。 2013年5月17日、アリババグループの最後のIBMミニコンピュータがAlipayでオフラインになり、クラウドファクトリーの「脱IOE」が緊急に必要であることが明らかになりました。 De-IOE とは、IBM、Oracle、EMC に代表されるミニコンピュータ、集中型データベース、ハイエンド ストレージで構成される従来の IT インフラストラクチャを廃止し、代わりに商用の x86 サーバー、オープン ソース データベース、分散ストレージを使用してインフラストラクチャ アーキテクチャを形成することを意味します。このインフラストラクチャはより柔軟で、拡張が容易であり、コスト上の利点も大きいです。そして、X86 はこの脱 IOE キャンペーンにおける最大の勝者です。 時が来れば、天と地は協力し合うでしょう。現在、クラウド コンピューティング ビル内のサーバーの 90% 以上は Intel の X86 です。今日のクラウド コンピューティングの構築は、Intel の X86 を基礎として構築されていると言えます。一方、X86 サーバーメーカーにとって、クラウド ファクトリーは要件がより厳しいものの、数量面で有利なため、調達コストも非常に低くなります。一方、X86 CPU は実際にはハード支出コストの大部分を占めています。 x86 サーバー業界全体が Intel のために働いていると不満を言う人もいます。 X86 はクラウド コンピューティング帝国を統一し、この帝国の王となりました。それを転覆させようとした数人の君主(権力、ARM)も隅に隠れており、さらに多くのRISCアーキテクチャが歴史の中で長い間失われてきました。 IBM のパワー プロセッサは、従来の通信、金融、証券、保険、電力の分野でのみ使用されています。 ARM のサーバーはまだ普及していません。 ARM バージョンのサービスを提供している企業の中には、事業が縮小されたり (Qualcomm)、事業の維持に苦労している企業 (Marvel) がいくつかある。 X86 は周囲を見回して満足しています。 X86 にはそんな自信がある。 x86 上で実行されるクラウド コンピューティングのオープン ソース クラウド オペレーティング システム ソフトウェア、データベース、およびストレージの世代は、X86 クラウド コンピューティング帝国の堀となっています。 X86 がクラウド コンピューティング帝国の王者の座に就き、その地位は揺るぎないものと思われたまさにそのとき、クラウド コンピューティングの空には 2 つの「小さな暗雲」が立ち込めていました。この2つの暗雲とは、AIチップとDPUです。これら 2 つの小さな暗雲がクラウド コンピューティングにおける X86 の地位に挑戦できるかどうかは、ポスト クラウド コンピューティング時代の大きな注目点です。 03 AIの饗宴 人工知能アルゴリズムの台頭により、CPU アーキテクチャは AI 固有のアプリケーションの処理にまったく利点がないことが認識されるようになりました。 CPU の計算、デコード、実行、メモリ アクセス、および書き戻し操作は、命令レベルの並列処理では開発できません。このタイプの AI アプリケーションでは、ほとんどの時間がメモリ アクセス (IO) に費やされ、実際にコンピューティングに使用される部分の効率は 20% 未満です。 単なる計算オフロードであれば、CPU はすでにそれに慣れています。 X86 CPU の場合、これは単に市場セグメントに対する有益な補足であり、異種コンピューティングの別名です。たとえば、Microsoft の Bing の検索アクセラレーションに使用されている FPGA など、FPGA を使用したさまざまなアクセラレーションはこのモデルです。しかし、トレンドは形成されておらず、CPU が心配する価値はありません。 「リアン・ポーは年老いているが、まだ生計を立てられるだろうか?」 過去には、power、sparc、mpis、ARM、X86 がありました。これらはすべて CPU 間の内戦でしたが、現在では AI などのアプリケーションでは CPU 処理構造全体が適用できなくなっていることが判明しています。 AIアルゴリズムの敵に直面して、CPUアーキテクチャはほぼ「全滅」しています。 しかし、AIは違います。誕生するや否や、IT 業界全体に影響を与える並外れた気質を持ち、すべてのプレイヤーを魅了しました。アーキテクチャの人気が高まると、必然的にアプリケーションの種類の人気も高まります。 ARM の成功の背景には、モバイル コンピューティング分野全体の台頭と、携帯電話や IoT などのさまざまなモバイル端末の急速な普及があります。クラウド コンピューティングにおける x86 の成功は、オープン ソース ソフトウェアとオープン アーキテクチャの成功です。 AIの時代では、このコンピューティングフレームワークに適応できないために疎外される可能性があります。 そして、将来、AI のアプリケーションがクラウドにおける主流のアプリケーションの 1 つとなり、あらゆるものが AI によって考え出せるようになると仮定すると、CPU がこの巨大なアプリケーションを見逃すことで支払う代償はどうなるでしょうか。その結果、クラウド CPU の地位は低下します。機械学習などのシナリオでは、CPU(中央処理装置)はコアアプリケーションから通常のコンピューティングノードにダウングレードされます。クラウド コンピューティング帝国の王から領主へ。 人工知能 (AI) の計算オフロード、トレーニング、推論に必要なコンピューティング リソースは、CPU の能力をはるかに超えています。汎用コンピューティング ノードに加えて、AI コンピューティング ノードという別の種類のコンピューティング ノードが登場しました。クラウド内のこのタイプのコンピューティング ノードのビジネスは、全体のビジネス量に依存します。 AIクラウドやスマートクラウドなどの概念が次々と導入されています。これらの概念が現実のものとなった場合、これらのクラウドにおける X86 の役割は目立たなくなるでしょう。 AIのトレンドはとても強いです。 GPGPU がその一例です。デフォルトで AI アクセラレーションをサポートするには GPGPU が必要です (SM ストリーム プロセッサ内にテンソル コアも必要です)。 GPGPU はつい最近まで単なる画像プロセッサでした。さらに、さまざまな XPU があり、そのコアアプリケーションも AI オフロードです。クラウド コンピューティングの黎明期における RISC と X86 の決闘と同様に、これはさまざまなアーキテクチャが決闘する新たな舞台です。唯一の違いは、今回は CPU が観客となり、これらの AI チップ アーキテクチャ (XPU) の決闘に参加する意思があるかどうかです。 X86 はこれに甘んじることなく、AVX 命令セットを通じてこの分野でのアプリケーションも強化しています。しかし、専用の AI チップや GPU と比較して、これらの機能が AI 時代に優位性を発揮できるかどうかは、まだ市場で試される段階です。 04 DPUストーム AI コンピューティングのオフロードが未開拓の領域の開拓であるならば、IO のオフロードはプリンスの復讐の別のバージョンのようなものだ。 10 年前、ネットワーク プロセッサ (NP) は非常に重要なタイプのプロセッサであり、主にパケット処理とプロトコル処理の高速化に使用され、さまざまなゲートウェイ、ファイアウォール、UTM などのデバイスで使用されていました。彼らは主に、MIPS から始まり、後に ARM に移行して、マルチコア NOC アーキテクチャを採用しました。 Cavium、Tileraなどの企業は最も優れた企業の中に含まれていました。 Intel の X86 アーキテクチャはネットワーク データ パケットの処理に非効率だったため、これらのネットワーク プロセッサには多くの機会があり、急速に発展しました。 しかし、その後、Intel は DPDK テクノロジを提案しました。 DPDK アプリケーションはユーザー空間で実行され、提供されるデータ プレーン ライブラリを使用してデータ パケットを送受信します。 Linux カーネル プロトコル スタックのパケット処理プロセスをバイパスするため、パケット転送速度が大幅に向上します。当初は専用のネットワーク プロセッサ NP の実装を必要としたゲートウェイ デバイスが、現在では X86 のパフォーマンス要件を満たし、この分野を順調に席巻し、ネットワーク プロセッサを歴史に葬り去りました。オリジナルのネットワーク プロセッサ企業も買収されました (tilera は EZchip に買収され、cavium は Marvel に買収されました)。 本来であればここで話は終わるのですが、クラウドコンピューティングの分野では、X86 サーバー、仮想マシン間のネットワーク交換、OVS などのアプリケーションはプロセッサのオーバーヘッドが非常に高く、CPU 負荷の大部分を占めています。スマート ネットワーク カードを介して OVS をオフロードし、ネットワーク機能のオフロードを実現するのは自然なアプリケーションです。これにより、X86 サーバーの負荷が軽減され、x86 の数が減少し、TCO (総所有コスト) が削減されます。 現在、スマート ネットワーク カードには、マルチコア ARM コアまたはその他の RISC コアが統合されており、X86 機能をオフロードします。これは、ネットワーク カードに別の方法で統合されていたネットワーク プロセッサ NP の復活です。 NP のベテランは決して死ぬことはありませんが、ゆっくりと統合されます。 ネットワーク機能のオフロードだけであれば問題ありません。データセンター アプリケーションの新しいモデルである DPU が登場しました。下図の DPU ネットワークでは、DPU がデータセンター全体の中核になっています。 DPU ネットワークを通じて、X86 コンピューティング ノード、GPU/ML AI コンピューティング ノード、ストレージ ノードが実現され、クラウド コンピューティング センター全体のビジネスが実現されます。 DPUは、RDMA、ネットワーク機能、ストレージ機能、セキュリティ機能、仮想化機能などを統合しており、将来のクラウドセンターを構築するための中核コンポーネントとなっています。この理想は非常に素晴らしいですが、現実は非常に厳しいです。 DPU は、予想通り、従来のスマート ネットワーク カード オフロードの範囲を超えて、データ センター構築の柱となることができるでしょうか?このアイデアと脳の穴は、アーキテクチャと思考の両面で驚くべきものであり、非常に合理的です。ただし、DPU がクラウド コンピューティング データ センターの次のリーダーになるかどうかは、DPU メーカーではなく、クラウド コンピューティング メーカーによって決まります。 では、クラウド コンピューティング メーカーはどのように計画するのでしょうか? Alibaba Cloud のベアメタルクラウドの構築では、ネットワークカード型デバイスに bm-hypervisor を直接配置するベアメタル HM-hive が提案されました。この形式では、すべてのコンピューティング リソースはコンピューティング ボードの一部であり、X86 の E5、Core I7、AMD、さらには ARM になることもあります。つまり、この構造では、X86 のステータスはコンピューティング ノードの 1 つにすぎません。 bm ハイパーバイザーは、DPDK の vswitch と SPDK のクラウド ストレージを通じて、すべてのコンピューティング ボードのすべての IO 要件を置き換えます。 BMHive は、ユーザーが bm ゲストのコンソールに接続するための VGA デバイスをサポートしています。 BM-Hive のアーキテクチャにより、既存のクラウド インフラストラクチャにシームレスに統合できるだけでなく、コンピューティング ボードの設計も非常に柔軟になります。唯一の必須要件は、virtio インターフェースをサポートすることです。 DPU と BM ハイパーバイザーは考え方が異なり、解決する問題も異なります。前者はオフロードであり、後者はベアメタルクラウド管理です。しかし、彼らの中心的なアイデアは、コンピューティング ノードを抽象化し、より専用かつ柔軟な方法でクラウド コンピューティング サービス全体に参加することです。これは共通点です。ただし、このトレンドが将来、DPU、スマート ネットワーク カード、その他の形式の BM ハイパーバイザー、またはより統合された形式で提示されるかどうかは不明です。 05 王たちの衝突 Nvidia が将来のクラウド コンピューティング センターを説明するとしたら、それは間違いなく GPU をノードとし、DPU を伝送チャネルとして GPU を直接使用し、他のすべてのノードがこの目的を果たすことになるでしょう。 CPU は単なる制御ノードです。 AMD と ARM のどちらを使用しても大きな違いはありません。そうでなければ、なぜNvidiaはARMの買収を検討するのでしょうか? Intel が将来のデータ センターを定義する場合、すべてのノードは x86 をコアとしてベースとなり、その他の AI 専用チップは単なる ASSP になります。 AVX の拡張命令を通じて、一部の AI アプリケーションもサポートできます。将来的には、AI アクセラレーションが Intel QAT 機能として CPU に統合される可能性があります。これは世界を支配する CPU であり、他の CPU は単なる手下です。 クラウド ファクトリーが将来のデータ センターを定義するとしたら、Intel の CPU、Nvidia の GPU、その他の XPU はすべて単なるコンピューティング ノードになります。一部は一般的なコンピューティングを担当し、その他はグラフィックスや画像処理、機械学習アルゴリズムを担当します。これらはオープンで、交換可能で、スケーラブルで、弾力性のあるコンピューティング ノードであり、オンデマンドでリソースを使用するだけで済みます。いわゆる「王」や「王子」は、クラウド コンピューティングの単なるツールです。 クラウドメーカーはインテルのために働くつもりはなく、また、Nvidia に誘拐されることも望んでいない。彼らは強力な技術、強い需要、そしてどのチップメーカーも無視できないほど大きな市場シェアを持っています。将来的には、これらのパブリック クラウド メーカーが地球上のコンピューティング能力において一定の地位を占めることになります。クラウドメーカーのニーズを満たす限り、独自の CPU、GPU、DPU、XPU、さらには統合 SOC を定義することもできます。クラウドメーカーは、次世代のコンピューティング システムの定義者および実践者になる可能性があります。 さらに、次世代クラウドコンピューティング帝国の「王者の戦い」に参加し、利益の一部を獲得したいと考えているチップメーカーも多数存在します。この2つの暗雲が新たなチャンスを生み出し、より多くのプレイヤーを引き付けることになるかどうか、注目に値する。 |
<<: ハイブリッド マルチクラウドがクラウドへの正しい道である理由は何ですか?
>>: モノのインターネットにおけるクラウドコンピューティングの応用の分析
4月2日、アリババクラウドは、新世代のエンタープライズレベルのECSとエラスティックベアメタルクラウ...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスブランド部門では、トップ...
ウェブマスターとして、Baidu は私たちに大きな影響を与えています。Baidu ランキングが高けれ...
組織が接続された IoT デバイスから情報を探し、新しい洞察と分析のストリームを確実に生成するにつれ...
[[329658]]導入現在、5 年間稼働している VMware の完全なセットを保有しています。...
ご存知のとおり、ソフト記事はオンラインプロモーションにおいて非常に重要な役割を果たします。高品質のソ...
みなさんこんにちは。私はインターネットのウェブサイト最適化を行う小規模な SEO 担当者です。200...
1990年代、アメリカのスーパーマーケットは興味深い現象を発見しました。ビールとおむつという一見無関...
最近、Kubernetes はバージョン 1.20 以降で Docker のサポートを中止することを...
はじめに:ロングテールキーワードには、ユーザーニーズを解決するものとトラフィックを追求するものの 2...
最近、100% Rebate Network、Baiye Alliance、Wanshang Sho...
ウェブサイトの所有者として、毎日さまざまな手段を通じてウェブサイトのランキング、人気、トラフィックを...
クラウド時代において、開発者は反復的な開発の手間を軽減するために、より便利で「軽量」なツールを緊急に...
5 ドル、2 コア、20G SSD、月間トラフィック 2T、あなたは何を思い浮かべますか?デジタルオ...
キャラクター紹介: Jack Chen は、「Pet Store」の主任アーキテクチャ アーキテクト...