Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

9月12日、Alibaba Cloudは最新世代のGPUインスタンスGN5iを正式にリリースしました。この製品は主にディープラーニングのオンライン推論段階に適しています。 TensorFlow などの主流のディープラーニング フレームワークをワンクリックで導入でき、インテリジェントなスケジューリング、自動運用・保守、リアルタイムの容量拡張などのサービスも提供できます。人工知能業界のユーザーは、GN5i を使用してマイクロ秒単位の応答時間で AI サービスを構築し、オンライン サービスのコストを 50% 以上削減できます。

Alibaba Cloudの公式サイトによると、GN5iはNVIDIAのPascalアーキテクチャP4グラフィックプロセッサを採用しており、45TopsのINT8整数演算能力と11TFlopsのFP32単精度浮動小数点演算能力を提供するという。データ処理スループットを満たしながら、レイテンシをマイクロ秒単位まで短縮できます。時間単位の支払いだけでなく、月単位や年単位のサブスクリプションもサポートしています。

さらに、自作 GPU サーバーでよく発生する困難な拡張や適応の問題に対応するため、GN5i 仕様ファミリーは柔軟で弾力性のある一連の構成を提供します。ディープラーニングの計算能力の要件に応じて適切な仕様をオンデマンドで選択し、数分でインスタンスを作成できます。また、コンピューティング能力の要件に応じて、GPU インスタンスの水平方向の拡張を「スケールアウト」したり、垂直方向の構成を「スケールアップ」したりすることもできます。

Alibaba Cloud のシニア技術専門家である Long Xin 氏は、AI ディープラーニングのオンライン推論シナリオに関しては、GN5i インスタンスが顧客に次のような価値をもたらすことができると述べています。

ディープラーニング推論タスクの処理効率を保証する安定したエンタープライズレベルの GPU コンピューティング機能。

TensorFlow、Caffe、MXNet、CNTK などの主流のディープラーニング フレームワークと完全に互換性があります。

Alibaba Cloud の高性能 SSD クラウド ストレージを搭載し、データの読み取りパフォーマンスを高速化します。 Alibaba Cloud の OSS ストレージ サービスと組み合わせることで、最高のストレージ費用対効果を実現できます。

データ処理スループットの要件を満たす場合、レイテンシはマイクロ秒レベルに達する可能性があります。

· 推論ベースの専用 GPU により、AI オンライン サービスの構築コストが大幅に削減されます。

GN5i の発売により、Alibaba Cloud の異種コンピューティング ファミリーの製品ラインがさらに充実します。モデルのトレーニングと学習のために、Alibaba Cloud は今年 5 月に高性能 GPU インスタンス GN5 をリリースしました。 1 つのインスタンスで、最大 8 個の NVIDIA P100 GPU、20,000 個を超える並列処理コア、75 TFLOPS FP32 単精度浮動小数点、150 TFLOPS FP16 半精度浮動小数点、37 TFLOPS FP64 倍精度浮動小数点のコンピューティング機能を提供できます。各 P100 には 16GB HBM2 3D スタック メモリが搭載されており、最大 732GB/秒のデータ転送速度を実現します。 GN5iと組み合わせることで、ディープラーニングの処理効率を効果的に確保できます。

製品レベルに加えて、Alibaba Cloud は、インテリジェントな音声対話、画像/ビデオ認識、トラフィック予測、感情分析、その他の技術サービスを含む、人工知能業界の包括的なサービスも提供しています。これらの技術は Alibaba Cloud ET を通じて輸出されています。過去1年間、アリババクラウドは、工場や病院の利益増大や診断精度の向上を目的とした、ET City Brain、ET Industrial Brain、ET Medical Brainなどの業界垂直型人工知能システムを立ち上げました。

<<:  Alibaba Cloud、人工知能の実装を加速する新しいFPGAコンピューティングインスタンスF2をリリース

>>:  Alibaba Cloud がクラウドベースの「スーパーコンピューティング センター」E-HPC を開始

推薦する

クラウド データベースの選択に必読: 要件を整理するにはどうすればよいでしょうか?

[[419550]]クラスター化されたデータベースが必要ですか?クラスター化されたデータベースには、...

KubeEdge に基づくエッジノードグループ化管理の設計と実装

KubeEdge 1.11 バージョンでは、クロスリージョン アプリケーション デプロイメント モデ...

ランキングアルゴリズムコンテンツの90%は4つの要素で決まる

私の意見 - 4つの要素がランキングアルゴリズムの90%を決定しますランキングのために検索マーケティ...

cycloneservers-$3.84/KVM/1g メモリ/2CPU/30g ハードディスク/2T トラフィック/ロサンゼルス

cycloneservers は 2009 年に設立されたブランドで、シアトル、ロサンゼルス、ノース...

クラウド コンピューティングによる混乱を経験している 3 つのホットな市場はどれですか?

クラウド ネイティブ コンピューティングは現在、業界最大かつ最も影響力のあるクラウド コンピューティ...

電子商取引企業が失敗する10の一般的な方法:単に製品を販売し、新しいメディアに関する知識が不足している

1. 純粋な販売思考コメント: これは、従来のブランドの従来のマーケティング思考が電子商取引の運営に...

クラウドコンピューティングが企業を変革し、モバイル化する方法

クラウドが世界をどのように変え、私たちがいかにしてこれほど迅速に仕事ができるようになったかについて、...

ハイブリッドクラウドでエッジコンピューティングを最適化する3つの方法

ハイブリッド クラウドの導入を通じてコン​​ピューティング リソースを分散しようとする企業の取り組み...

ビットコインとWe-mediaは2013年のインターネット業界の流行語トップ10にランクイン

今年も年末となり、様々な業界の見直しが始まりました。インターネット業界にとって、1年間の変化は驚くべ...

良い結果: ethernetservers-768M メモリ VPS 簡易評価

私は ethernetservers から VPS を 3.49 ドルで購入しました (特別オファー...

Google Pandaアルゴリズムが正式にリリース: SEO担当者が行うべき変更

みなさんこんにちは。私はMuzi Chengzhouです。 3月、Googleのパンダアルゴリズムが...

KServe: 堅牢でスケーラブルなクラウドネイティブモデルサーバー

Kubeflow に精通している場合は、KFServing がプラットフォームのモデル サーバーと推...

Wikibon: 「真のプライベートクラウド」が今年のクラウドの成長と革新を牽引

クラウド市場の「真のプライベート クラウド」(TPC) セグメントは、クラウド運用モデルへの世界的な...

ブラック 5 プロモーション: a2hosting-50% オフ/SSD/無制限のスペース/SS サポート

A2hosting、ブラックフライデーがやって来ました! SSD ハード ドライブを搭載した仮想ホス...