アリババクラウドの第8世代エンタープライズクラスインスタンスG8iがアップグレードされ、コンピューティング能力が向上しました。全体的なマシンパフォーマンスは85％向上し、AI推論速度は最大7倍に向上しました。

アリババクラウドは1月11日、第8世代エンタープライズレベル汎用コンピューティングインスタンスECS g8iのコンピューティング能力がさらにアップグレードされたと発表した。これは、コードネーム「Emerald Rapids」と呼ばれる第5世代Intel Xeonスケーラブル・プロセッサーの国内初発売となる。 Alibaba Cloud が独自に開発した「Feitian + CIPU」アーキテクチャシステムを採用することで、ECS g8i インスタンスの全体的なパフォーマンスが最大 85% 向上し、AI 推論パフォーマンスが最大 7 倍向上します。最大 72B のパラメータを持つ大規模な言語モデルをサポートできるため、小規模および中規模のモデルの構築コストを 50% 削減できます。同時に、新しいインスタンスはエンドツーエンドのセキュリティ保護も提供し、企業が信頼できる AI アプリケーションを構築するための強力なプライバシー強化コンピューティングパワーサポートを提供します。

Alibaba Cloudのエラスティックコンピューティング製品ラインのゼネラルマネージャーである張先涛氏は、「 Alibaba Cloud ECS g8iインスタンスの強力なパフォーマンスは、CPU中心のコンピューティングシステムにもAI推論を加速する大きな可能性があることを証明しています。パブリッククラウドは、超大規模なAIモデルを処理できるだけでなく、AIアプリケーションの実装を加速するための新しい道を切り開きます」と述べています。

インテルの中国データセンターおよび人工知能グループのXeonクライアントソリューション部門ゼネラルマネージャー、リー・ヤドン氏は次のように述べた。「最新の第5世代インテルXeon®スケーラブル・プロセッサーには、各コアにAIアクセラレーション機能が組み込まれており、要求の厳しいAIワークロードに十分対応できます。前世代と比較して、AIトレーニングのパフォーマンスは最大29％向上し、AI推論能力は最大42％向上しました。アリババクラウドの第8世代エンタープライズクラスインスタンス（ECS g8i）を通じて、開発者がテクノロジーの包摂を実現し、AIテクノロジーをユビキタスにすることを支援したいと考えています。」

一般的な計算能力がさらに向上し、全体的なパフォーマンスが85％向上しました

エンタープライズレベルの汎用コンピューティングインスタンスであるECS g8i インスタンスは、コンピューティング、ストレージ、ネットワーク、セキュリティ機能が総合的に向上しています。主要なパラメータとしては、 ECS g8i インスタンスのL3 キャッシュ容量が 320 MB に増加し、メモリ速度は 5600 MT/s に達し、全体的なパフォーマンスは 85% 向上し、シングルコアパフォーマンスは 25% 向上しました。ストレージに関しては、ESSD クラウドディスクは 100 万 IOPS を提供し、NVMe を完全装備し、ストレージレイテンシは 100 マイクロ秒と低くなっています。ネットワーク面では、PPSが3,000万と高く、Alibaba Cloudが独自に開発したeRDMA大規模アクセラレーション機能を標準装備し、レイテンシは8マイクロ秒と低くなっています。セキュリティの面では、ECS g8i インスタンスは、信頼できるコンピューティングや暗号化コンピューティングなどの機能をサポートし、機密性の高い仮想マシン向けの TDX テクノロジーを世界で初めてサポートし、包括的なセキュリティ保護を構築します。

E2E シナリオでは、ECS g8i インスタンスはMySQL のパフォーマンスを最大 60%、Redis と Nginx のパフォーマンスをそれぞれ 40% と 24% 向上させ、ゲーム、ライブビデオストリーミング、e コマース、金融、ヘルスケア、エンタープライズサービスなどの業界に強力なコンピューティングパワーサポートを提供し、データベース、ビッグデータ、AI 推論などのアプリケーションシナリオにおける厳しいパフォーマンス要件を満たします。

さらに、ECS g8i インスタンスは、QAT や IAA などのアクセラレータを含むさまざまなハードウェアネイティブアクセラレーション機能も提供します。 Alibaba Cloud は独自のテクノロジーを使用して、ハードウェアアクセラレーション機能をインスタンス仮想マシンにさらに細かく送信し、小規模な ECS g8i インスタンスにもアクセラレーション機能を持たせています。その中で、QATネイティブ暗号化および復号化アクセラレータであるECS g8i インスタンスのパフォーマンスは、圧縮/解凍シナリオで最大 70 倍向上し、暗号化および復号化のパフォーマンスは 4 倍以上向上します。

AIを高速化し、72Bパラメータの大規模言語モデルをサポート

生成 AI によってもたらされた技術革命は、コンピューティングのパラダイムに根本的な変化をもたらしています。現在、AI 大規模モデル推論は、計算能力に関して依然として多くの課題に直面しています。たとえば、最初のパケットの遅延は並列処理機能と浮動小数点計算機能によって制限され、スループットパフォーマンスはメモリ帯域幅とネットワーク遅延によって制限されます。

Alibaba Cloud ECS g8i インスタンスは、組み込み命令セットを AVX512 から Intel AMX アドバンスドマトリックスエクステンションアクセラレーションテクノロジーにアップグレードするなど、これらの課題に対処するために大幅に最適化されており、これにより生成 AI の実行速度が向上します。 AVX512 命令セットと比較すると、AMX AI アクセラレーションを有効にすると、ECS g8i インスタンスの int 8 行列計算のパフォーマンスが最大 7 倍向上します。

g8iはAMX AIアクセラレーション機能をベースに、小規模・中規模のパラメータモデルへの対応をより迅速に行うことができ、知識検索、質問応答システム、要約生成などのAIワークロードを実行する場合、 A10 GPUクラウドサーバーに比べて初期構築コストが50%削減されます。さらに、Alibaba Cloud プラットフォームのスポットプリエンプティブインスタンスにより、コストの優位性がさらに強調され、 AI 推論のコストがさらに削減されます。

同時に、自社開発のeRDMA超低遅延弾性ネットワークをベースにしたAlibaba Cloud g8iインスタンスクラスターは、超低遅延ネットワークと高い弾力性の利点を備えており、72Bパラメータの大規模言語モデルの分散推論を容易にサポートできます。推論パフォーマンスはクラスターのサイズに応じてほぼ直線的に加速され、32 バッチサイズを超える超大規模パラメータスケールの AI モデル負荷をサポートし、テキストグラフィックス、AI コード生成、仮想アシスタント、クリエイティブ支援ツールなどの AI ワークロードを実行できます。

Alibaba Cloud Tongyi Qianwenがオープンソース化したQwen-72B 大型モデルを例にとると、 g8i インスタンスの eRDMA ネットワーク上に構築されたクラスターで効率的に運用できます。入力が 500 ワード未満の場合、最初のパケットの遅延は 3 秒未満で、 1 秒あたり 7 個のトークンを生成できます。

セキュリティを強化し、企業が信頼できるAIアプリケーションを構築できるよう支援します

セキュリティの面では、Alibaba Cloud は、データ保存、データ転送、データコンピューティングの全プロセスのセキュリティを確保するために、製品ライン全体にわたってエンドツーエンドのセキュリティ保護を構築しています。最下層では、CIPU ベースのセキュリティアーキテクチャに、ハードウェアの信頼のルートとしてセキュリティチップ TPM が装備されており、サーバーの信頼できる起動を実現し、改ざんがゼロであることを保証します。仮想化レベルでは、仮想信頼機能 vTPM をサポートし、インスタンス起動プロセスのコアコンポーネントの検証機能を提供します。インスタンスの信頼に基づいて、さまざまなプラットフォームの機密コンピューティング機能をサポートし、実行状態でのメモリデータの分離と暗号化保護を実現します。

アップグレードされた ECS g8i インスタンスは、 Trust Domain Extension TDX の技術的機能を完全にサポートしていることは注目に値します。ビジネスアプリケーションは変更なしで TEE に展開できるため、技術的なハードルが大幅に下がります。また、パフォーマンスの低下が極めて少ない大規模モデルなどの AI アプリケーションにプライバシーが強化されたコンピューティング能力を提供し、大規模モデルのクラウドデータのセキュリティを保護します。

Qwen-Chat-7B モデルを例にとると、TDX を有効にすると、モデル推論のセキュリティと信頼性が確保されるだけでなく、データの機密性と整合性も保護されます。

「アリババクラウドは今後も技術の深化と製品革新を続け、企業にさらに安定的、強力、安全かつ柔軟なコンピューティングサービスを提供し、さまざまな業界でのAIアプリケーションの本格的な爆発的な普及を促進していきます」と張先涛は述べた。

<<: Baidu Shendou: AIネイティブアプリケーションを作るには2つのステップが重要

>>: AI 用に開発されたスーパーチップは、クラウドコンピューティングのパワーを地元企業に還元するのでしょうか?

アリババクラウドの第8世代エンタープライズクラスインスタンスG8iがアップグレードされ、コンピューティング能力が向上しました。全体的なマシンパフォーマンスは85％向上し、AI推論速度は最大7倍に向上しました。

一般的な計算能力がさらに向上し、全体的なパフォーマンスが85％向上しました

AIを高速化し、72Bパラメータの大規模言語モデルをサポート

セキュリティを強化し、企業が信頼できるAIアプリケーションを構築できるよう支援します

マルチクラウド管理の課題を克服するにはどうすればよいでしょうか?

分散データセットの依存性とキャッシュ SparkRDD

AWS、Azureなどが賭けたパブリッククラウドの成功体験とは？

gigsgigscloud-28USD/年/シンガポールKVM/512MB RAM/20GB SSD/500GB 帯域幅

Pacificrack: 米国のクラスター VPS、月額 5.2 ドルから、複数の C セグメントがランダムに割り当てられ、Windows をサポート

クラウドコンピューティングの力: 重要な政府データのリアルタイムの可視性を確保

ガートナー 2020 SFA マジッククアドラントの解釈: SaaS は春秋戦国時代へ

Kubernetes、エッジからコア、クラウドまでをカバーするコンテナ

本当に価値のあるコンテンツは必ずしも「人気」があるとは限らない

ファーウェイとパートナーが共同でOSS/BSS統合ラボを構築し、クラウドネットワーク産業の発展を加速

推薦する

ガートナー：中国のクラウド価格戦争はインフラと運用のクラウド戦略を変える

tmhhost: 全ハイエンドラインVPS、香港（3つのネットワーク）cn2 gia、日本cn2、韓国cn2、米国（3つのネットワーク）cn2 gia、米国cn2gia200G高防御

2012 年に草の根ウェブマスターがウェブサイト構築時に避けるべきいくつかの間違い

Pacificrack: 中秋節特別オファー、アジアに最適化されたルートを備えた米国 VPS が年間 15 ドルから、1G メモリ/1 コア/20g SSD/500g トラフィック/1Gbps 帯域幅

三国競争は単なる表面的な現象なのでしょうか？国内パブリッククラウド市場は活況を呈している

入札ランキングで勝つための5つのステップ

ウェブサイトの実際のコンテンツは最適化の重要な要素です

TurnkeyInternet - 月額 1.48 ドルのプレミアム Web ホスティング

gandi-.at ドメイン登録/初年度 6.25 USD

ウェブサイトデザイン：ユーザーインターフェースデザインにおける「状態」と「アクション」の表現

クラウドネイティブアプリケーションを構築するにはどうすればいいですか?

Google アナリティクスのトラフィックソースとその実装方法

検索エンジンの下で直接回答を提供するSERPページを要約する

英国メディア：英国は米国のクラウドコンピューティングへの依存から脱却するために強力な自国のコンピューティング力を構築する必要がある

gatenode-4$/Xen/512m メモリ/30g ハードディスク/2T トラフィック/フェニックスシティ/サイト全体で 50% 割引