新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

2018年のTmall Double 11はテクノロジーの世界で多くの新記録を樹立しました。記録の一つは、11日にアリババが全プラットフォームを通じてユーザー向けに453億件のパーソナライズされた推奨を行ったことだ。推奨された写真の合計長さは地球を 70 周できるほどです。

Tmall/Taobao Mobile で買い物をする場合、画像はトランスコードされ、さまざまな形式や解像度で表示されます。そのため、通常よりも数倍高いトランスコード需要を満たすために、バックエンド システムに強力な計算能力が必要になります。 FPGA は、プログラマブル チップの中で、このタイプの並列コンピューティングを処理するための最もエネルギー効率の高いソリューションです。かつては「名声と富の殿堂」にひっそりと属していたこの企業は、クラウド コンピューティングの付加価値を通じて、ますます多くの技術革新を推進しています。

今年のXDF 2018カンファレンスで、アリババクラウドのエンジニア***がアリババクラウドのFPGAプラットフォーム「Sunny」の秘密を業界に公開し、この新しいクラウドコンピューティング加速エンジンがその潜在力を発揮し始めました。

FPGA を知る: コンピューティングを高速化する新しいエンジン

FPGA の最大の特徴は、ハードウェア プログラミングに直接基づいており、高スループット、低レイテンシなどの特性を持ち、データ並列チャネルや完全なパイプライン並列性を簡単に構築できることです。 ASIC と比較して、ソフトウェアによるプログラミング性と柔軟性を備えているため、大規模な計算能力に対する厳しい要求があり、依然として急速な反復期間にある AI などのシナリオに最適です。

FPGA 機能モデル

しかし、従来の FPGA オフライン開発プロセスは非常に面倒です。 IP プロバイダーやソリューション インテグレーターは、ハードウェアを自ら開発および保守する必要があるため、プロモーションが困難になり、コストもかかります。顧客にとっては、開発時にハードウェアリンクを避けることはできず、試行錯誤のコストが高く、サイクルも長くなります。

FPGA + クラウドはこれらの問題を解決するための最適なソリューションです。 Alibaba Cloudのエンジニアである張振祥氏によると、「Suntech」プラットフォームは、チップのオリジナルメーカー、ハードウェア、IPサプライヤーなど、従来のFPGA業界チェーンの複数のリンクを統合し、プラットフォームリソースにパッケージ化することで、顧客がコンピューティングパワーの実現に集中できるようにし、IPサプライヤーは配信プロセスを簡素化し、配信サイクルと運用コストを大幅に最適化できるという。

2017年8月以来、Suningは3世代にわたる製品の改良を行ってきました。最新の F3 シリーズ インスタンスは、1,000 万を超えるロジック ユニットと最大 47 TeraMAC の DSP コンピューティング パワーを提供できます。

時系列データベースを例にとると、Suning プラットフォームの処理効率は CPU の 30 倍以上であり、シングル チャネル FPGA で測定されたピーク性能は 2.97GB/s です。比較すると、シングルコア CPU 圧縮の測定パフォーマンスは約 90M/s です。画像認識のシナリオでは、Suning F3 が提供する計算能力は 7 台の CPU サーバーとほぼ同等であり、設備投資コストを大幅に削減します。 CPU サーバーと比較すると、TCO が 40% 以上削減されます。

さらに、この機能は拡張可能です。開発者が高性能コンピューティングや機械学習を扱う場合、多くの場合、複数のチップを組み合わせて計算する必要があります。 「Suntech」は、さまざまな高速インターフェースを提供し、1/2/4 チップ相互接続トポロジーを完成でき、動的構成をサポートします。カード内のデュアルチップ通信を例にとると、帯域幅は600Gbpsと高く、複数の軽量伝送プロトコルを同時にサポートし、伝送効率は95%です。

素顔を垣間見る:百戦錬磨の戦士

Alibaba 社内では、「Sunty」は実際に戦闘で鍛えられており、Double 11、シティ ブレイン、時系列データベース、高解像度ビデオのエンコードとデコード、FPGA アクセラレーションを伴うその他のスター ビジネスなど、超大規模なコンピューティング シナリオをサポートしています。

ダブル11を例にとると、顧客がタオバオ/Tmallアプリやウェブサイトで商品を閲覧する場合、写真は

異なる形式または解像度。 Suning プラットフォームの並列コンピューティング機能により、画像処理の遅延が直接削減されます。

CPU サーバーの 50% に減らすと、スループットが数倍に増加します。

遺伝子分野でも、「サンテック」は優れた業績を残しました。 100Gbpの全ゲノム解析の時間が2時間に短縮され、従来の10倍のスピードとなり、単価も大幅に削減されました。全ゲノムとは、種の細胞内の最初の DNA から最後の DNA までの完全なゲノム配列を分析することを指します。この技術はゲノム内のほぼあらゆる種類の変異を識別することができます。

複雑なものを簡素化:開発のハードルを大幅に下げる

従来のソフトウェア エンジニアの目から見ると、FPGA チップの開発ハードルは非常に高いです。一方では、HDL ハードウェア プログラミングを理解する必要があり、他方では、基盤となるハードウェアとインターフェイスに精通している必要があります。

XDFカンファレンスでは、Alibaba CloudエンジニアのPan Yue氏がSuningプラットフォームソリューションを紹介しました。

まず、「Suning」はC、C++、OpenCLなどの高水準システム言語のサポートを追加しました。これにより、開発者は使い慣れたプログラミング言語やワークフローでスムーズに使用でき、CPUやGPUをベースにした開発をクラウド上のFPGAデバイスに簡単に移植できるようになります。同時に、Alibaba Cloud は、開発者がシステムを迅速に構築できるように、多数のリファレンス デザインと開発パッケージも提供しています。

インターフェースに関しては、「Suntech」はDDR4/5、PCIe、DMAなどを含む統一された標準バスインターフェースを提供します。開発者は何もする必要はなく、内部ロジックの実装(図の灰色の部分)だけに注意を払う必要があります。

さらに、Alibaba Cloud は、さまざまな主流 FPGA 向けの Shell+Role 実装もサポートしており、クロスプラットフォームのマルチブート ソリューションに適応できるため、ユーザーはクロスプラットフォームの移行を簡単に完了できます。

IP暗号化分離: セキュリティに妥協なし

FPGA エコシステムの最も重要な部分として、IP メーカーはクラウド内のマルチテナント環境に非常に関心を持っています。 IP製品が流出しないようにし、ユーザーが購入したIPはユーザー自身だけが使用できるようにする必要があります。

このため、Alibaba Cloud は IP 暗号化、ネットワーク分離、IP 所有権と使用権の分離を採用し、ユーザーのソース コード (または IP ソース コード)、配布パッケージ、展開環境がプロセス全体を通じて第三者から完全に見えなくなるようにします。また、根本的な障害を迅速に認識し、リアルタイムのアラームを生成するヘルス監視機能も提供します。

Suning プラットフォームに最も早く参加した IP プロバイダーの 1 つである CTAccel の CEO である Yu Haile 博士は、次のように述べています。「クラウドに移行した後、セキュリティは当社の最大の関心事です。Alibaba Cloud のセキュリティ分離は非常に優れているため、導入の第一候補として Alibaba Cloud を選択しました。」

変わらない使命:包括的な異種エコシステムを共同で構築する

これまで、アリババクラウドのスローガン「計り知れない価値のために」は常に人々の心に深く根付いており、インクルーシブコンピューティングを積極的に推進してきました。異種コンピューティング依存関係の開始以来、Alibaba Cloud の開発者はより強力な GPU/FPGA インスタンスをより低価格で使用できるようになり、ディープラーニング分野での開発コストが半分以上削減されました。

より多くの開発者がFPGAのメリットを享受できるように、Alibaba CloudはFPGAエラスティッククラウドサーバーを立ち上げ、FPGAイメージ市場を確立しました。これにより、革新的なアイデアと成熟したソリューションを備えたIP製品がプラットフォームを通じて目立つようになり、市場規模が拡大し、研究開発の進歩が加速し、設計の安定性が向上しました。

「サンテックは、アリババクラウドが人工知能産業を実現するための強力なツールです。より多くの開発者がアリババクラウドFPGAエコシステムに参加し、産業における技術の実装を促進することを歓迎します」と張振祥は述べた。

<<:  SAP Smart Cloud Suite は、中原ホームファニシングがホームファニシング業界のデジタル革命をリードするのを支援します

>>:  Kubernetes を監視する際に避けるべき 4 つの落とし穴

推薦する

検索エンジン最適化の発展と出口に直面

私が初めて SEO に触れたのは 2002 年です。SEO に携わる人なら、2003 年の中国の S...

江新鵬:百度アルゴリズムの概要

Baiduのアルゴリズムについては多くの憶測が飛び交っています。最近、Baiduのアルゴリズム計画の...

業界ポータルSEOのボトルネック期間を解決する方法

みなさんこんにちは。私は徐子宇です。私はこれまで、企業サイトのSEO最適化業務に携わってきました。正...

SuningやJD.comなどの電子商取引企業は、今年の中秋節をどのようにマーケティングに活用したのでしょうか?

月収10万元の起業の夢を実現するミニプログラム起業支援プラン「中秋節のキンモクセイの茂みを思い出しま...

5月第3週の国内ドメイン名解決プロバイダートップ10:HiChinaのシェアは20.61%に上昇

IDC Review Network (idcps.com) は 5 月 26 日に次のように報告し...

K8S のローリングアップグレードを 1 つの記事で理解する

パート01.アップグレード戦略 K8S では、 spect.strategy を使用して、古い Po...

企業がクラウド移行を成功させるための 10 のベスト プラクティス

[51CTO.com クイック翻訳] クラウド コンピューティング テクノロジーがもたらす利便性と利...

#Sysadmin Day# itldc: 9 つのデータセンターの VPS が 50% オフ、トラフィック無制限、専用サーバーが 50% オフ

Sysadmin Day を記念して、itldc は 27 日から 7 日間のプロモーションを開始し...

ボストンニュース:あなたのスイートスポットはどこですか?

インターネットの発展により、オンライン検索の機会はますます増えています。しかし、従来の企業が競争に遅...

マルチクラウド戦略から学んだ教訓

Intrado の CTO である Thomas Squeo 氏は最近、複数のクラウドの使用と社内の...

ウェブサイトのSEOにおけるリンクの役割について

外部リンクの公開は面倒なものです。前回の記事「ロングテールはいかに追いかけるかがカギ」でも述べたよう...

日産、高性能コンピューティングのためにOracle Cloud Infrastructureに移行

日産自動車は、オンプレミスのハイパフォーマンス・コンピューティング (HPC) ワークロードを Or...