アリババクラウドは1月11日、第8世代エンタープライズレベル汎用コンピューティングインスタンスECS g8iのコンピューティング能力がさらにアップグレードされたと発表した。これは、コードネーム「Emerald Rapids」と呼ばれる第5世代Intel Xeonスケーラブル・プロセッサーの国内初発売となる。 Alibaba Cloud が独自に開発した「Feitian + CIPU」アーキテクチャ システムを採用することで、ECS g8i インスタンスの全体的なパフォーマンスが最大 85% 向上し、AI 推論パフォーマンスが最大 7 倍向上します。最大 72B のパラメータを持つ大規模な言語モデルをサポートできるため、小規模および中規模のモデルの構築コストを 50% 削減できます。同時に、新しいインスタンスはエンドツーエンドのセキュリティ保護も提供し、企業が信頼できる AI アプリケーションを構築するための強力なプライバシー強化コンピューティング パワー サポートを提供します。 Alibaba Cloudのエラスティックコンピューティング製品ラインのゼネラルマネージャーである張先涛氏は、「 Alibaba Cloud ECS g8iインスタンスの強力なパフォーマンスは、CPU中心のコンピューティングシステムにもAI推論を加速する大きな可能性があることを証明しています。パブリッククラウドは、超大規模なAIモデルを処理できるだけでなく、AIアプリケーションの実装を加速するための新しい道を切り開きます」と述べています。 インテルの中国データセンターおよび人工知能グループのXeonクライアントソリューション部門ゼネラルマネージャー、リー・ヤドン氏は次のように述べた。「最新の第5世代インテルXeon®スケーラブル・プロセッサーには、各コアにAIアクセラレーション機能が組み込まれており、要求の厳しいAIワークロードに十分対応できます。前世代と比較して、AIトレーニングのパフォーマンスは最大29%向上し、AI推論能力は最大42%向上しました。アリババクラウドの第8世代エンタープライズクラスインスタンス(ECS g8i)を通じて、開発者がテクノロジーの包摂を実現し、AIテクノロジーをユビキタスにすることを支援したいと考えています。」 一般的な計算能力がさらに向上し、全体的なパフォーマンスが85%向上しましたエンタープライズレベルの汎用コンピューティングインスタンスであるECS g8i インスタンスは、コンピューティング、ストレージ、ネットワーク、セキュリティ機能が総合的に向上しています。主要なパラメータとしては、 ECS g8i インスタンスのL3 キャッシュ容量が 320 MB に増加し、メモリ速度は 5600 MT/s に達し、全体的なパフォーマンスは 85% 向上し、シングルコア パフォーマンスは 25% 向上しました。ストレージに関しては、ESSD クラウド ディスクは 100 万 IOPS を提供し、NVMe を完全装備し、ストレージ レイテンシは 100 マイクロ秒と低くなっています。ネットワーク面では、PPSが3,000万と高く、Alibaba Cloudが独自に開発したeRDMA大規模アクセラレーション機能を標準装備し、レイテンシは8マイクロ秒と低くなっています。セキュリティの面では、ECS g8i インスタンスは、信頼できるコンピューティングや暗号化コンピューティングなどの機能をサポートし、機密性の高い仮想マシン向けの TDX テクノロジーを世界で初めてサポートし、包括的なセキュリティ保護を構築します。 E2E シナリオでは、ECS g8i インスタンスはMySQL のパフォーマンスを最大 60%、Redis と Nginx のパフォーマンスをそれぞれ 40% と 24% 向上させ、ゲーム、ライブ ビデオ ストリーミング、e コマース、金融、ヘルスケア、エンタープライズ サービスなどの業界に強力なコンピューティング パワー サポートを提供し、データベース、ビッグ データ、AI 推論などのアプリケーション シナリオにおける厳しいパフォーマンス要件を満たします。 さらに、ECS g8i インスタンスは、QAT や IAA などのアクセラレータを含むさまざまなハードウェア ネイティブ アクセラレーション機能も提供します。 Alibaba Cloud は独自のテクノロジーを使用して、ハードウェア アクセラレーション機能をインスタンス仮想マシンにさらに細かく送信し、小規模な ECS g8i インスタンスにもアクセラレーション機能を持たせています。その中で、QATネイティブ暗号化および復号化アクセラレータであるECS g8i インスタンスのパフォーマンスは、圧縮/解凍シナリオで最大 70 倍向上し、暗号化および復号化のパフォーマンスは 4 倍以上向上します。 AIを高速化し、72Bパラメータの大規模言語モデルをサポート生成 AI によってもたらされた技術革命は、コンピューティングのパラダイムに根本的な変化をもたらしています。現在、AI 大規模モデル推論は、計算能力に関して依然として多くの課題に直面しています。たとえば、最初のパケットの遅延は並列処理機能と浮動小数点計算機能によって制限され、スループット パフォーマンスはメモリ帯域幅とネットワーク遅延によって制限されます。 Alibaba Cloud ECS g8i インスタンスは、組み込み命令セットを AVX512 から Intel AMX アドバンスド マトリックス エクステンション アクセラレーション テクノロジーにアップグレードするなど、これらの課題に対処するために大幅に最適化されており、これにより生成 AI の実行速度が向上します。 AVX512 命令セットと比較すると、AMX AI アクセラレーションを有効にすると、ECS g8i インスタンスの int 8 行列計算のパフォーマンスが最大 7 倍向上します。 g8iはAMX AIアクセラレーション機能をベースに、小規模・中規模のパラメータモデルへの対応をより迅速に行うことができ、知識検索、質問応答システム、要約生成などのAIワークロードを実行する場合、 A10 GPUクラウドサーバーに比べて初期構築コストが50%削減されます。さらに、Alibaba Cloud プラットフォームのスポットプリエンプティブインスタンスにより、コストの優位性がさらに強調され、 AI 推論のコストがさらに削減されます。 同時に、自社開発のeRDMA超低遅延弾性ネットワークをベースにしたAlibaba Cloud g8iインスタンスクラスターは、超低遅延ネットワークと高い弾力性の利点を備えており、72Bパラメータの大規模言語モデルの分散推論を容易にサポートできます。推論パフォーマンスはクラスターのサイズに応じてほぼ直線的に加速され、32 バッチサイズを超える超大規模パラメータスケールの AI モデル負荷をサポートし、テキスト グラフィックス、AI コード生成、仮想アシスタント、クリエイティブ支援ツールなどの AI ワークロードを実行できます。 Alibaba Cloud Tongyi Qianwenがオープンソース化したQwen-72B 大型モデルを例にとると、 g8i インスタンスの eRDMA ネットワーク上に構築されたクラスターで効率的に運用できます。入力が 500 ワード未満の場合、最初のパケットの遅延は 3 秒未満で、 1 秒あたり 7 個のトークンを生成できます。 セキュリティを強化し、企業が信頼できるAIアプリケーションを構築できるよう支援しますセキュリティの面では、Alibaba Cloud は、データ保存、データ転送、データコンピューティングの全プロセスのセキュリティを確保するために、製品ライン全体にわたってエンドツーエンドのセキュリティ保護を構築しています。最下層では、CIPU ベースのセキュリティ アーキテクチャに、ハードウェアの信頼のルートとしてセキュリティ チップ TPM が装備されており、サーバーの信頼できる起動を実現し、改ざんがゼロであることを保証します。仮想化レベルでは、仮想信頼機能 vTPM をサポートし、インスタンス起動プロセスのコア コンポーネントの検証機能を提供します。インスタンスの信頼に基づいて、さまざまなプラットフォームの機密コンピューティング機能をサポートし、実行状態でのメモリデータの分離と暗号化保護を実現します。 アップグレードされた ECS g8i インスタンスは、 Trust Domain Extension TDX の技術的機能を完全にサポートしていることは注目に値します。ビジネス アプリケーションは変更なしで TEE に展開できるため、技術的なハードルが大幅に下がります。また、パフォーマンスの低下が極めて少ない大規模モデルなどの AI アプリケーションにプライバシーが強化されたコンピューティング能力を提供し、大規模モデルのクラウド データのセキュリティを保護します。 Qwen-Chat-7B モデルを例にとると、TDX を有効にすると、モデル推論のセキュリティと信頼性が確保されるだけでなく、データの機密性と整合性も保護されます。 「アリババクラウドは今後も技術の深化と製品革新を続け、企業にさらに安定的、強力、安全かつ柔軟なコンピューティングサービスを提供し、さまざまな業界でのAIアプリケーションの本格的な爆発的な普及を促進していきます」と張先涛は述べた。 |
<<: Baidu Shendou: AIネイティブアプリケーションを作るには2つのステップが重要
>>: AI 用に開発されたスーパーチップは、クラウド コンピューティングのパワーを地元企業に還元するのでしょうか?
Kafka のスループットは一般的なメッセージキューよりも高く、最速であることはよく知られています。...
lcayun/Leicaクラウドサーバーメーカーは、国内認定のエンタープライズサーバーマーチャントで...
ウェブサイトは1週間11位にランクされています。他のランキングがどのように変化しても、私のウェブサイ...
サイトの SEO の観点から、タイトルの長さはサイトの最適化に影響しますか? この質問に対する答えは...
vpscheap.net は、低価格 VPS 業界では比較的古い企業です。2010 年に設立され、非...
Tripodcloudは、クリスマスと新年を前に特別にいくつかの新しいサーバー(E5-2690v2、...
[[358359]]調査会社ガートナーは、適切な戦略を採用しないと、クラウド プラットフォームに移行...
QuestMobileのデータによると、2018年4月時点で、中国の男性モバイルインターネットユーザ...
過去数年間で、IT インフラストラクチャはハイブリッドおよびマルチクラウド モデルへと進化してきまし...
先日開催されたアメリカ物理学会2019年3月の会議において、 IBMは量子ムーアの法則を正式に提唱し...
まず最初に、私がこの要約を書いた理由を紹介したいと思います。 1年前、私はAlibabaやVipsh...
1. 初期段階ではアカウントは1つだけサービス番号は?企業?サブスクリプションアカウント?多くの企業...
JD.comのWeChatにおけるメインの入り口5月28日、JD.comグループは昨日夕方、WeCh...
シンガポールの VPS 販売業者である Hosteons は、おそらく皆さんもよくご存知でしょう。同...
著者:顧暁波本日、2014 GMIC グローバル モバイル インターネット カンファレンスが開幕しま...