Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

Alibaba Cloud、AIコストを50%削減する次世代異種インスタンスGN5iを発表

9月12日、Alibaba Cloudは最新世代のGPUインスタンスGN5iを正式にリリースしました。この製品は主にディープラーニングのオンライン推論段階に適しています。 TensorFlow などの主流のディープラーニング フレームワークをワンクリックで導入でき、インテリジェントなスケジューリング、自動運用・保守、リアルタイムの容量拡張などのサービスも提供できます。人工知能業界のユーザーは、GN5i を使用してマイクロ秒単位の応答時間で AI サービスを構築し、オンライン サービスのコストを 50% 以上削減できます。

Alibaba Cloudの公式サイトによると、GN5iはNVIDIAのPascalアーキテクチャP4グラフィックプロセッサを採用しており、45TopsのINT8整数演算能力と11TFlopsのFP32単精度浮動小数点演算能力を提供するという。データ処理スループットを満たしながら、レイテンシをマイクロ秒単位まで短縮できます。時間単位の支払いだけでなく、月単位や年単位のサブスクリプションもサポートしています。

さらに、自作 GPU サーバーでよく発生する困難な拡張や適応の問題に対応するため、GN5i 仕様ファミリーは柔軟で弾力性のある一連の構成を提供します。ディープラーニングの計算能力の要件に応じて適切な仕様をオンデマンドで選択し、数分でインスタンスを作成できます。また、コンピューティング能力の要件に応じて、GPU インスタンスの水平方向の拡張を「スケールアウト」したり、垂直方向の構成を「スケールアップ」したりすることもできます。

Alibaba Cloud のシニア技術専門家である Long Xin 氏は、AI ディープラーニングのオンライン推論シナリオに関しては、GN5i インスタンスが顧客に次のような価値をもたらすことができると述べています。

ディープラーニング推論タスクの処理効率を保証する安定したエンタープライズレベルの GPU コンピューティング機能。

TensorFlow、Caffe、MXNet、CNTK などの主流のディープラーニング フレームワークと完全に互換性があります。

Alibaba Cloud の高性能 SSD クラウド ストレージを搭載し、データの読み取りパフォーマンスを高速化します。 Alibaba Cloud の OSS ストレージ サービスと組み合わせることで、最高のストレージ費用対効果を実現できます。

データ処理スループットの要件を満たす場合、レイテンシはマイクロ秒レベルに達する可能性があります。

· 推論ベースの専用 GPU により、AI オンライン サービスの構築コストが大幅に削減されます。

GN5i の発売により、Alibaba Cloud の異種コンピューティング ファミリーの製品ラインがさらに充実します。モデルのトレーニングと学習のために、Alibaba Cloud は今年 5 月に高性能 GPU インスタンス GN5 をリリースしました。 1 つのインスタンスで、最大 8 個の NVIDIA P100 GPU、20,000 個を超える並列処理コア、75 TFLOPS FP32 単精度浮動小数点、150 TFLOPS FP16 半精度浮動小数点、37 TFLOPS FP64 倍精度浮動小数点のコンピューティング機能を提供できます。各 P100 には 16GB HBM2 3D スタック メモリが搭載されており、最大 732GB/秒のデータ転送速度を実現します。 GN5iと組み合わせることで、ディープラーニングの処理効率を効果的に確保できます。

製品レベルに加えて、Alibaba Cloud は、インテリジェントな音声対話、画像/ビデオ認識、トラフィック予測、感情分析、その他の技術サービスを含む、人工知能業界の包括的なサービスも提供しています。これらの技術は Alibaba Cloud ET を通じて輸出されています。過去1年間、アリババクラウドは、工場や病院の利益増大や診断精度の向上を目的とした、ET City Brain、ET Industrial Brain、ET Medical Brainなどの業界垂直型人工知能システムを立ち上げました。

<<:  Alibaba Cloud、人工知能の実装を加速する新しいFPGAコンピューティングインスタンスF2をリリース

>>:  Alibaba Cloud がクラウドベースの「スーパーコンピューティング センター」E-HPC を開始

推薦する

専用マインド - 7ドル/4コア/2IP/2gメモリ/100gハードディスク/2Tトラフィック

ヘンズは、Intel Xeon E5620 クアッドコア CPU、最低 64G のメモリ、RAID1...

アマゾン ウェブ サービスの中国における「12345」戦略

[51CTO.com からのオリジナル記事]企業が長期的な成功を維持するのは簡単なことではありません...

SEO 外部リンク

正午に、グループのメンバーから、ウェブサイトを最適化する方法を尋ねられました。実は、私は正式な SE...

スナップショットが2度目の復元。Baiduが再びその威力を発揮するのか?

現在、中国のほとんどのウェブサイトはBaiduで自然ランキングされています。最近の不安定さにより、ウ...

Spring Cloud はマイクロサービス アーキテクチャを構築します: 分散サービス トラッキング (はじめに)

これまでの N 回のブログ投稿の紹介を通じて、実際にそれらを使用してビジネス ニーズを満たす基本的な...

誰でも使えるアジャイルメトリクスツール! Kyligence ZenがGAバージョンを正式にリリース

4月11日、Kyligence Indicator Platform製品発表会が盛況のうちに開催され...

経済の不確実性と気候変動が将来のネットワークを再構築する

今日、動的な作業環境、変化するデバイス要件、経済の不確実性などの市場の力により、新しい働き方、ビジネ...

究極の最適化には、サイト内外の同時改善が必要

SEO 業界の敷居がどんどん低くなるにつれて、競争もますます激しくなっています。では、このような激し...

クラウド コンピューティング チームの IT 後継者計画を作成する方法

[[347768]] IT 従業員が退職する前に、組織は後任者が仕事を円滑に遂行できるように、適切な...

フロントエンド検索のユーザーをターゲットにしたオンラインアライアンスの広告配置戦略について簡単に説明します。

長い間記事を書いていませんでした。今日は、オンラインアライアンスの広告戦略と、オンラインアライアンス...

企業研修会社のウェブサイトを最適化する方法

著者は 1 年以上ウェブサイトの最適化に取り組んできました。最適化の手法を常に探求し、良い経験をまと...

中国スマート端末市場半期レポート

今年上半期のスマート端末市場の動向についてお話しします。 QuestMobileのデータによると、市...

中国のプライベートクラウド市場は急速に発展しており、華雲データが新たな勢力として台頭している。

2017年、世界のクラウドコンピューティング市場は成長を続け、クラウドコンピューティング業界の規模は...

企業の新しいウェブサイトが立ち上げられた後にいくつかの大きな誤解

現代人、特にビジネスオーナーは急いでいます。彼らは常に、自分のウェブサイトがオンラインになり、明日に...