チップの革新に10年を費やしたAmazon Web Servicesは、デジタル変革のためのクラウドハードウェア「アクセラレータ」を提供します

半世紀にわたって続いたムーアの法則により、必然的に多くの人々は、常に同じコストでより強力なコンピューティングリソースを入手できるという幻想を抱くようになりました。実際、ムーアの法則は、ゴードン・ムーアが 1960 年代に経験した結果に過ぎず、自然の法則ではありません。企業がデジタル変革を加速するにつれ、コンピューティング能力に対する需要が急増し、チップ製造プロセスは物理的な限界に近づき続けています。汎用チップのコストが上昇しているため、ムーアの法則の実装が困難になっています。

そのため、「ポスト・ムーア時代」を見据えた企業は、高品質な開発を確保しながらデジタルトランスフォーメーションを推進できる性能とコストの関係を維持するための実現可能な技術的ルートを模索し始めています。 10 年以上前、Amazon Web Services は、クラウドインフラストラクチャにおける汎用チップの非効率的なパフォーマンスとエネルギー損失に気づき始め、クラウドコンピューティング向けにカスタマイズされたチップとハードウェアに注目し始めました。 Amazon Web Services は、クラウド環境の複雑さに関する深い理解と、基盤となるテクノロジーが上位レベルのアプリケーションに与える影響に関する深い洞察に基づいて、独自のチップを作成する道を歩み始めました。

「十分では十分ではない」

クラウドコンピューティング向けの自社開発チップの開発の重要性について、Amazon Web Servicesの最高技術責任者であるWerner Vogels氏は、2022 re:Invent Global Conferenceで次のように述べた。「十分な品質というのは、決して十分ではない」。たとえば、開発者が強力な GPU を使用して機械学習モデルの構築からトレーニング、推論までのプロセス全体を実行する場合、GPU がさまざまなタスクに対して最適化されていないため、パフォーマンスの低下は想像を超えることが多く、開発者は高いハードウェアおよびエネルギーコストも負担する必要があります。

クラウドコンピューティングのユーザーは、必然的にさらに強力なコンピューティング能力を追求し続けるでしょうが、「量と価格の両方の増加」を望むユーザーはいません。このため、Amazon Web Services は、今世紀初頭からクラウドコンピューティング向けのカスタマイズされたハードウェアの開発を開始し、2006 年に最初のAmazon Elastic Compute Cloud (Amazon EC2)インスタンスをリリースしました。それ以来、クラウドベースのビジネスの多様性と複雑さが増し、コスト削減と効率性の向上を求めるユーザーの要求が高まるにつれて、Amazon Web Services は、基盤となるテクノロジーのカスタマイズされたイノベーションが、クラウドコンピューティングの急速な発展に不可欠な要素となることを認識してきました。

2013 年、Amazon Web Services はクラウドサーバー仮想化エンジンである Amazon Nitro システムを発表し、基盤となるクラウドコンピューティング技術分野で業界をリードする 10 年の幕開けとなりました。アマゾンウェブサービスは、2015 年に Annapurna Labs を買収した後、自社開発チップの急速な発展の道を歩み始めました。同社は2017年までに、仮想化システム、クラウドネイティブプロセッサ、機械学習トレーニングおよび推論チップなど、数多くの自社開発チップを開発しました。 Amazon Web Services の自社開発チップにより、Amazon EC2 インスタンスの数が急速に増加しました。現在、Amazon EC2 インスタンスには 600 種類以上あり、ほぼすべてのオペレーティングシステムとアプリケーションをカバーしているため、何百万もの顧客が Amazon Web Services 上で最も適切なソリューションを見つけて、厳しいビジネスニーズを満たすことができます。

仮想化によるパフォーマンスの低下を排除

仮想化カスタムチップの Nitro シリーズは、Amazon Web Services が独自の「チップ」を独自に作成するための出発点です。クラウドコンピューティングの基礎である仮想化は、かつてはコンピューティングリソースの 30% を占めていました。つまり、ユーザーが購入したコンピューティングパワーの約 3 分の 1 が、実質的なコンピューティングパワーのリターンを得ることなく「チケット」になってしまったのです。

Nitro の重要な目標の 1 つは、基盤となるテクノロジーによる仮想化パフォーマンスの低下の問題を解決することです。 Nitro はカスタマイズされたチップと独立したモジュール設計を通じて、クラウドコンピューティングシステムのすべての仮想化機能を引き受け、仮想化によるパフォーマンスの低下を 1% 未満 (ほぼ無視できるレベル) に抑え、ユーザーが購入したインスタンスのコンピューティング能力をほぼ 100% ビジネスに活用できるようにします。同時に、Nitro のセキュリティチップは、ユーザーにハードウェアレベルのセキュリティメカニズムを提供します。これは、ネットワークとストレージの分離による独立したセキュリティチャネルを実現するだけでなく、データ転送のあらゆる側面でハードウェアレベルの暗号化を実装し、ユーザーがより強力なデータセキュリティを実現できるようにします。

Amazon Web Services は 2013 年から 2020 年にかけて Nitro を第 4 世代にアップデートしており、Nitro のアップグレードは現在も継続中です。昨年の 2022 re:Invent Global Conference で、Amazon Web Services は新しい第 5 世代 Nitro を発表し、データ処理機能がさらに向上し、レイテンシが短縮されました。パフォーマンスの向上をエネルギー消費率に換算すると、第 5 世代 Nitro はワットあたりのパフォーマンスが 40% 向上し、ユーザーに別の次元でより高いコストパフォーマンスをもたらします。

これに伴い、第 5 世代 Nitro を搭載した新しいインスタンス Amazon EC2 C7gn もリリースされました。最新世代の Nitro のサポートにより、C7gn は現在の世代の C6gn と比較してネットワーク処理能力が強化されており、すべての Amazon EC2 ネットワーク最適化インスタンスの中で最高のネットワーク帯域幅とパケット転送パフォーマンスを提供できるインスタンスとなっています。 C7gn インスタンスは、コンピューティングパフォーマンスが最大 25% 向上し、暗号化パフォーマンスが最大 2 倍向上するため、ユーザーは Amazon EC2 で最も要求の厳しいネットワーク集約型ワークロードのコストを最適化し、スケーラビリティを向上させることができます。

Amazon EC2 C7gn インスタンス

自社開発チップの継続的なアップグレードと大規模なアプリケーションにより、ユーザーに高いコスト効率をもたらします。

Nitro は、ユーザーがコンピューティング能力の損失に別れを告げるのに役立ちますが、ユーザーはどのようにして既存のコンピューティング能力を使用してムーアの法則を上回ることができるのでしょうか?

Amazon Web Services の CEO である Adam Selipsky 氏はかつてこう言っています。「あらゆるワークロードのコンピューティングのコスト効率を根本から改善したいのであれば、インスタンスを根本から考え直す必要があります。この目標を達成するには、基盤となるテクノロジーを深く掘り下げて、チップに直接取り組む必要があります。」最終的に、Amazon Web Services が出した答えは、ARM アーキテクチャに基づく汎用クラウドネイティブプロセッサである Graviton でした。

X86 アーキテクチャと比較すると、Graviton は低コストと高コア密度のため、高コンピューティング密度の分野でより多くの利点があり、エネルギー消費性能も優れています。しかし、当時、ARM アーキテクチャは、クラウドコンピューティングに基づくエンタープライズレベルのアプリケーションの分野では画期的な進歩を遂げていませんでした。 ARM アーキテクチャを採用するということは、Amazon Web Services がユーザーベースがほとんどない領域に参入しなければならないことを意味します。

Amazon Web Services は 2018 年に第 1 世代の Graviton プロセッサをリリースし、その後 2020 年に Graviton 2 をリリースして大規模なアプリケーションを実現し、ARM プロセッサのエンタープライズレベルアプリケーションのベンチマークを確立しました。同時に、Graviton の各世代ではパフォーマンスが大幅に向上しています。 2021年に発表されたGraviton 3は、前世代と比較してシングルコア性能が25％向上し、浮動小数点性能が2倍に向上しています。さらに、ARM アーキテクチャを使用しているため、x86 インスタンスと比較して最大 60% のエネルギー消費削減も実現します。

近年、人工知能や自動運転などの新興アプリケーションの負荷とコスト効率がハイパフォーマンスコンピューティングに最適化されたインスタンスに対して飛躍的に高まっていることから、Amazon Web Servicesは、浮動小数点およびベクトル命令演算に特化して最適化されたGraviton 3Eと、それがサポートするハイパフォーマンスコンピューティングに最適化されたインスタンスHpc7gを2022 re:Invent Global Conferenceでリリースしました。 Hpc7g は、現世代の Hpc6a インスタンスに比べて 20% のパフォーマンス向上を実現し、最大数万のコアを備えた高性能コンピューティングクラスターで複雑な計算を実行できるようにすることで、計算流体力学、気象シミュレーション、ゲノミクス、分子動力学などの高性能コンピューティングワークロードに超高コストパフォーマンスを提供し、難易度の上昇という問題にさらに対処し、高性能コンピューティングワークロードのコストを削減します。

ユーザーに高いコスト効率を提供し、ユーザーが Graviton インスタンスを採用しやすくするために、Amazon Web Services は Graviton 上で 20 を超えるマネージドサービスを実行しており、この数は増え続けています。これらのサービスには、よく使用されるAmazon Relational Database Service 、 Amazon Aurora 、 Amazon ElastiCache 、 Amazon MemoryDB for Redis 、 Amazon OpenSearch 、 Amazon EMR 、 Amazon Elastic Kubernetes Service 、 Amazon Lambdaが含まれます。マネージドサービスにより、顧客がアプリケーションを Graviton に移行する際の複雑さが大幅に軽減され、移行にかかる時間が数日から数分に短縮されます。また、Graviton インスタンスに移行することでコスト効率が最大 40% 向上します。

機械学習のあらゆる側面を扱うための専門的な「コア」

機械学習が徐々に超大規模モデルの時代に入るにつれ、数十億パラメータのモデルが至る所に存在し、計算能力を圧迫するブラックホールとなっています。これによって消費される計算能力とコストも、企業を圧倒する原因となります。

機械学習で広く使用されている汎用チップは、約 2 年ごとにパフォーマンスを 2 倍にすることができますが、それでもトレーニングモデルの複雑さの増大に追いつくことはできません。 Amazon Web Services は、機械学習向けに特別に最適化されていない GPU は、長期的にはクラウド上で機械学習タスクを処理できないと考えています。唯一の解決策は、分散マルチプロセッサを使用して、ネットワーク上でモデルを共同で計算することです。この目的のために、Amazon Web Services は、機械学習の 2 つの側面をターゲットに、トレーニング用の Amazon Trainium チップと推論用の Amazon Inferentia チップをリリースしました。

2022 年 10 月、Amazon Web Services は、クラウド内の高性能モデル向けに特別に構築された Trainium ベースの Amazon EC2 Trn1 インスタンスをリリースしました。最大 16 個の Trainium チップを搭載でき、512 GB の高帯域幅メモリと 800 Gbps のネットワーク帯域幅を備えています。 2022 re:Invent Global Conference で、Amazon Web Services は、ネットワーク帯域幅が 1.6Tbps に増加した拡張 Trn1n インスタンスをリリースしました。超大規模クラスター上に 10,000 個を超える Trainium チップを構築することで、超大規模モデルの並列トレーニングが可能になります。

Amazon Web Services は 2018 年に推論用の Inferentia チップをリリースし、翌年には対応する Amazon EC2 Inf1 インスタンスをリリースしました。これにより、ユーザーは低レイテンシで低コストの推論を実現できます。 2022 re:Invent Global Conference において、Amazon Web Services は、ディープラーニングモデルの規模と複雑さの急激な増大に対応するため、次世代推論チップ Inferentia 2 と、このチップをベースにした Amazon EC2 Inf2 インスタンスをリリースしました。 Inf2 インスタンスは、大規模な Transformer モデルの分散推論専用に構築された唯一のインスタンスです。 Inf1 インスタンスと比較すると、Inf2 インスタンスではスループットが 4 倍、レイテンシが 1/10、ワットあたりのパフォーマンスが 45% 向上しています。 Inf2 インスタンスは、最大 1,750 億のパラメータを持つ大規模なモデルを実行できます。これは、GPT-3、Mask R-CNN、ViT などの超大規模で複雑なモデルには十分です。

10年にわたる先導を経て、ハードウェアのイノベーションは加速期に入った。

アメリカのコンピュータ科学者でチューリング賞受賞者のアラン・ケイ氏はかつてこう言った。「ソフトウェアに真剣に取り組む人は、自分のハードウェアを自分で作るべきだ。」 Amazon Web Services の 10 年間のイノベーションは、この声明と一致しています。長年にわたる独自のチップとハードウェアの徹底的な研究開発を通じて、基盤技術レベルで大きな差別化された優位性を確立しました。

近年、クラウドコンピューティングにおけるカスタマイズされたハードウェアイノベーションの重要性が注目され、認識される企業が増えています。 Amazon Web Services の最高技術責任者である Werner Vogels 氏は、「2023 年には、専用チップの使用が急速に増加し、ワークロードはハードウェアの最適化を活用してパフォーマンスを最大化し、エネルギー消費とコストを削減するようになる」と予測しています。これはまた、カスタマイズされたハードウェアがクラウドコンピューティングパワーの最も信頼性の高い成長エンジンの 1 つになり、ユーザーがコストとパフォーマンスの面で優れたリターンを得て、高品質のエンタープライズ開発をサポートするデジタル機能を獲得するのに役立つことを意味します。

<<: 調査によると、マルチクラウドの最大の推進要因は依然としてコスト

>>: API サーバーソースコード分析: エントリポイント分析