新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

2018年のTmall Double 11はテクノロジーの世界で多くの新記録を樹立しました。記録の一つは、11日にアリババが全プラットフォームを通じてユーザー向けに453億件のパーソナライズされた推奨を行ったことだ。推奨された写真の合計長さは地球を 70 周できるほどです。

Tmall/Taobao Mobile で買い物をする場合、画像はトランスコードされ、さまざまな形式や解像度で表示されます。そのため、通常よりも数倍高いトランスコード需要を満たすために、バックエンド システムに強力な計算能力が必要になります。 FPGA は、プログラマブル チップの中で、このタイプの並列コンピューティングを処理するための最もエネルギー効率の高いソリューションです。かつては「名声と富の殿堂」にひっそりと属していたこの企業は、クラウド コンピューティングの付加価値を通じて、ますます多くの技術革新を推進しています。

今年のXDF 2018カンファレンスで、アリババクラウドのエンジニア***がアリババクラウドのFPGAプラットフォーム「Sunny」の秘密を業界に公開し、この新しいクラウドコンピューティング加速エンジンがその潜在力を発揮し始めました。

FPGA を知る: コンピューティングを高速化する新しいエンジン

FPGA の最大の特徴は、ハードウェア プログラミングに直接基づいており、高スループット、低レイテンシなどの特性を持ち、データ並列チャネルや完全なパイプライン並列性を簡単に構築できることです。 ASIC と比較して、ソフトウェアによるプログラミング性と柔軟性を備えているため、大規模な計算能力に対する厳しい要求があり、依然として急速な反復期間にある AI などのシナリオに最適です。

FPGA 機能モデル

しかし、従来の FPGA オフライン開発プロセスは非常に面倒です。 IP プロバイダーやソリューション インテグレーターは、ハードウェアを自ら開発および保守する必要があるため、プロモーションが困難になり、コストもかかります。顧客にとっては、開発時にハードウェアリンクを避けることはできず、試行錯誤のコストが高く、サイクルも長くなります。

FPGA + クラウドはこれらの問題を解決するための最適なソリューションです。 Alibaba Cloudのエンジニアである張振祥氏によると、「Suntech」プラットフォームは、チップのオリジナルメーカー、ハードウェア、IPサプライヤーなど、従来のFPGA業界チェーンの複数のリンクを統合し、プラットフォームリソースにパッケージ化することで、顧客がコンピューティングパワーの実現に集中できるようにし、IPサプライヤーは配信プロセスを簡素化し、配信サイクルと運用コストを大幅に最適化できるという。

2017年8月以来、Suningは3世代にわたる製品の改良を行ってきました。最新の F3 シリーズ インスタンスは、1,000 万を超えるロジック ユニットと最大 47 TeraMAC の DSP コンピューティング パワーを提供できます。

時系列データベースを例にとると、Suning プラットフォームの処理効率は CPU の 30 倍以上であり、シングル チャネル FPGA で測定されたピーク性能は 2.97GB/s です。比較すると、シングルコア CPU 圧縮の測定パフォーマンスは約 90M/s です。画像認識のシナリオでは、Suning F3 が提供する計算能力は 7 台の CPU サーバーとほぼ同等であり、設備投資コストを大幅に削減します。 CPU サーバーと比較すると、TCO が 40% 以上削減されます。

さらに、この機能は拡張可能です。開発者が高性能コンピューティングや機械学習を扱う場合、多くの場合、複数のチップを組み合わせて計算する必要があります。 「Suntech」は、さまざまな高速インターフェースを提供し、1/2/4 チップ相互接続トポロジーを完成でき、動的構成をサポートします。カード内のデュアルチップ通信を例にとると、帯域幅は600Gbpsと高く、複数の軽量伝送プロトコルを同時にサポートし、伝送効率は95%です。

素顔を垣間見る:百戦錬磨の戦士

Alibaba 社内では、「Sunty」は実際に戦闘で鍛えられており、Double 11、シティ ブレイン、時系列データベース、高解像度ビデオのエンコードとデコード、FPGA アクセラレーションを伴うその他のスター ビジネスなど、超大規模なコンピューティング シナリオをサポートしています。

ダブル11を例にとると、顧客がタオバオ/Tmallアプリやウェブサイトで商品を閲覧する場合、写真は

異なる形式または解像度。 Suning プラットフォームの並列コンピューティング機能により、画像処理の遅延が直接削減されます。

CPU サーバーの 50% に減らすと、スループットが数倍に増加します。

遺伝子分野でも、「サンテック」は優れた業績を残しました。 100Gbpの全ゲノム解析の時間が2時間に短縮され、従来の10倍のスピードとなり、単価も大幅に削減されました。全ゲノムとは、種の細胞内の最初の DNA から最後の DNA までの完全なゲノム配列を分析することを指します。この技術はゲノム内のほぼあらゆる種類の変異を識別することができます。

複雑なものを簡素化:開発のハードルを大幅に下げる

従来のソフトウェア エンジニアの目から見ると、FPGA チップの開発ハードルは非常に高いです。一方では、HDL ハードウェア プログラミングを理解する必要があり、他方では、基盤となるハードウェアとインターフェイスに精通している必要があります。

XDFカンファレンスでは、Alibaba CloudエンジニアのPan Yue氏がSuningプラットフォームソリューションを紹介しました。

まず、「Suning」はC、C++、OpenCLなどの高水準システム言語のサポートを追加しました。これにより、開発者は使い慣れたプログラミング言語やワークフローでスムーズに使用でき、CPUやGPUをベースにした開発をクラウド上のFPGAデバイスに簡単に移植できるようになります。同時に、Alibaba Cloud は、開発者がシステムを迅速に構築できるように、多数のリファレンス デザインと開発パッケージも提供しています。

インターフェースに関しては、「Suntech」はDDR4/5、PCIe、DMAなどを含む統一された標準バスインターフェースを提供します。開発者は何もする必要はなく、内部ロジックの実装(図の灰色の部分)だけに注意を払う必要があります。

さらに、Alibaba Cloud は、さまざまな主流 FPGA 向けの Shell+Role 実装もサポートしており、クロスプラットフォームのマルチブート ソリューションに適応できるため、ユーザーはクロスプラットフォームの移行を簡単に完了できます。

IP暗号化分離: セキュリティに妥協なし

FPGA エコシステムの最も重要な部分として、IP メーカーはクラウド内のマルチテナント環境に非常に関心を持っています。 IP製品が流出しないようにし、ユーザーが購入したIPはユーザー自身だけが使用できるようにする必要があります。

このため、Alibaba Cloud は IP 暗号化、ネットワーク分離、IP 所有権と使用権の分離を採用し、ユーザーのソース コード (または IP ソース コード)、配布パッケージ、展開環境がプロセス全体を通じて第三者から完全に見えなくなるようにします。また、根本的な障害を迅速に認識し、リアルタイムのアラームを生成するヘルス監視機能も提供します。

Suning プラットフォームに最も早く参加した IP プロバイダーの 1 つである CTAccel の CEO である Yu Haile 博士は、次のように述べています。「クラウドに移行した後、セキュリティは当社の最大の関心事です。Alibaba Cloud のセキュリティ分離は非常に優れているため、導入の第一候補として Alibaba Cloud を選択しました。」

変わらない使命:包括的な異種エコシステムを共同で構築する

これまで、アリババクラウドのスローガン「計り知れない価値のために」は常に人々の心に深く根付いており、インクルーシブコンピューティングを積極的に推進してきました。異種コンピューティング依存関係の開始以来、Alibaba Cloud の開発者はより強力な GPU/FPGA インスタンスをより低価格で使用できるようになり、ディープラーニング分野での開発コストが半分以上削減されました。

より多くの開発者がFPGAのメリットを享受できるように、Alibaba CloudはFPGAエラスティッククラウドサーバーを立ち上げ、FPGAイメージ市場を確立しました。これにより、革新的なアイデアと成熟したソリューションを備えたIP製品がプラットフォームを通じて目立つようになり、市場規模が拡大し、研究開発の進歩が加速し、設計の安定性が向上しました。

「サンテックは、アリババクラウドが人工知能産業を実現するための強力なツールです。より多くの開発者がアリババクラウドFPGAエコシステムに参加し、産業における技術の実装を促進することを歓迎します」と張振祥は述べた。

<<:  SAP Smart Cloud Suite は、中原ホームファニシングがホームファニシング業界のデジタル革命をリードするのを支援します

>>:  Kubernetes を監視する際に避けるべき 4 つの落とし穴

推薦する

Baiduプロモーションが更新され、「プロモーション」から「Baiduプロモーション」にアップグレードされました

Baiduプロモーションが更新され、「プロモーション」から「Baiduプロモーション」にアップグレー...

電話実名制、9月から導入へ、利用者情報漏洩に最高3万ルピーの罰金

重慶ビジネスデイリーは、9月1日から、国民は固定電話の設置や携帯電話関連サービスを申し込む際に実名を...

SEOの3つの柱の利点を分析する

この図の目的は、SEO の 3 つの基礎要素、つまり検索エンジンで上位にランクされる 3 つの重要な...

外部リンクを貼る際に無視できない影響:ユーザーのクリック行動

Cai Cai は SEO の専門家ではありませんが、考えることが大好きな SEO 担当者です。 B...

ネットワークエッジで IoT の合法的な傍受を実行するにはどうすればよいでしょうか?

モノのインターネット (IoT) アプリケーションとスマート デバイスの人気の高まりにより、4G ネ...

Sihua Technology がクラウド時代のストレージをどのように定義しているかをご覧ください (ビデオ インタビュー)

[51CTO.com からのオリジナル記事] ビッグデータ時代の到来により、従来のストレージ アーキ...

不要なクラウドサービスのコストを削減する方法

初期コストが比較的低いため、ビジネス マネージャーが独自のクラウド予算を管理できる場合もありますが、...

私の当初の理解について話す

独創性はウェブサイトの最適化のプロセスにおいて重要な役割を果たします。特に、高品質のオリジナル記事は...

JVM における TLAB の謎を解明

[[413891]]この記事はWeChatの公開アカウント「プログラマーの成長」から転載したもので、...

エルケの突然の人気から、​​国内ブランドが長期的な成功を収める方法についてお話ししましょう。

昨日から今に至るまで、私の友人の輪にはERKEに関するメッセージが殺到しています。多くの人の記憶の中...

racknerd: ロサンゼルスの格安 VPS が 3 日間限定でプロモーションを実施、年間 14 ドル、1G メモリ/1 コア/20g SSD/3T トラフィック/1Gbps 帯域幅

本日、racknerd は特別イベントを開催しました。米国西海岸で販売が中止されていた 3 つのロサ...

ウェブサイトの包含を改善する方法

ウェブサイトの組み込みは、検索エンジンのキーワードランキングの基礎です。組み込まれていないウェブペー...

Evernote 8周年:CエンドとBエンドのレイアウトが完成し満足のいく結果に

(北京、2020年8月20日) 本日、ナレッジマネジメントプラットフォームEvernoteは創立8周...

市場を開拓する必要があり、キーワードの最適化には忍耐が必要です

実際、キーワードの最適化には、より多くの粘り強さと忍耐が必要です。以前は、検索エンジンの不完全さのた...

SEO最適化におけるウェブマスター最適化アンカーテキストリンクの役割

ウェブマスターがウェブサイトに外部リンクを構築する場合、純粋なテキストリンク形式とアンカーテキスト外...