新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

新しいクラウドアクセラレーションエンジンがダブル11でデビュー:アリババクラウドのFPGAプラットフォーム「サンテック」の詳細な分析

2018年のTmall Double 11はテクノロジーの世界で多くの新記録を樹立しました。記録の一つは、11日にアリババが全プラットフォームを通じてユーザー向けに453億件のパーソナライズされた推奨を行ったことだ。推奨された写真の合計長さは地球を 70 周できるほどです。

Tmall/Taobao Mobile で買い物をする場合、画像はトランスコードされ、さまざまな形式や解像度で表示されます。そのため、通常よりも数倍高いトランスコード需要を満たすために、バックエンド システムに強力な計算能力が必要になります。 FPGA は、プログラマブル チップの中で、このタイプの並列コンピューティングを処理するための最もエネルギー効率の高いソリューションです。かつては「名声と富の殿堂」にひっそりと属していたこの企業は、クラウド コンピューティングの付加価値を通じて、ますます多くの技術革新を推進しています。

今年のXDF 2018カンファレンスで、アリババクラウドのエンジニア***がアリババクラウドのFPGAプラットフォーム「Sunny」の秘密を業界に公開し、この新しいクラウドコンピューティング加速エンジンがその潜在力を発揮し始めました。

FPGA を知る: コンピューティングを高速化する新しいエンジン

FPGA の最大の特徴は、ハードウェア プログラミングに直接基づいており、高スループット、低レイテンシなどの特性を持ち、データ並列チャネルや完全なパイプライン並列性を簡単に構築できることです。 ASIC と比較して、ソフトウェアによるプログラミング性と柔軟性を備えているため、大規模な計算能力に対する厳しい要求があり、依然として急速な反復期間にある AI などのシナリオに最適です。

FPGA 機能モデル

しかし、従来の FPGA オフライン開発プロセスは非常に面倒です。 IP プロバイダーやソリューション インテグレーターは、ハードウェアを自ら開発および保守する必要があるため、プロモーションが困難になり、コストもかかります。顧客にとっては、開発時にハードウェアリンクを避けることはできず、試行錯誤のコストが高く、サイクルも長くなります。

FPGA + クラウドはこれらの問題を解決するための最適なソリューションです。 Alibaba Cloudのエンジニアである張振祥氏によると、「Suntech」プラットフォームは、チップのオリジナルメーカー、ハードウェア、IPサプライヤーなど、従来のFPGA業界チェーンの複数のリンクを統合し、プラットフォームリソースにパッケージ化することで、顧客がコンピューティングパワーの実現に集中できるようにし、IPサプライヤーは配信プロセスを簡素化し、配信サイクルと運用コストを大幅に最適化できるという。

2017年8月以来、Suningは3世代にわたる製品の改良を行ってきました。最新の F3 シリーズ インスタンスは、1,000 万を超えるロジック ユニットと最大 47 TeraMAC の DSP コンピューティング パワーを提供できます。

時系列データベースを例にとると、Suning プラットフォームの処理効率は CPU の 30 倍以上であり、シングル チャネル FPGA で測定されたピーク性能は 2.97GB/s です。比較すると、シングルコア CPU 圧縮の測定パフォーマンスは約 90M/s です。画像認識のシナリオでは、Suning F3 が提供する計算能力は 7 台の CPU サーバーとほぼ同等であり、設備投資コストを大幅に削減します。 CPU サーバーと比較すると、TCO が 40% 以上削減されます。

さらに、この機能は拡張可能です。開発者が高性能コンピューティングや機械学習を扱う場合、多くの場合、複数のチップを組み合わせて計算する必要があります。 「Suntech」は、さまざまな高速インターフェースを提供し、1/2/4 チップ相互接続トポロジーを完成でき、動的構成をサポートします。カード内のデュアルチップ通信を例にとると、帯域幅は600Gbpsと高く、複数の軽量伝送プロトコルを同時にサポートし、伝送効率は95%です。

素顔を垣間見る:百戦錬磨の戦士

Alibaba 社内では、「Sunty」は実際に戦闘で鍛えられており、Double 11、シティ ブレイン、時系列データベース、高解像度ビデオのエンコードとデコード、FPGA アクセラレーションを伴うその他のスター ビジネスなど、超大規模なコンピューティング シナリオをサポートしています。

ダブル11を例にとると、顧客がタオバオ/Tmallアプリやウェブサイトで商品を閲覧する場合、写真は

異なる形式または解像度。 Suning プラットフォームの並列コンピューティング機能により、画像処理の遅延が直接削減されます。

CPU サーバーの 50% に減らすと、スループットが数倍に増加します。

遺伝子分野でも、「サンテック」は優れた業績を残しました。 100Gbpの全ゲノム解析の時間が2時間に短縮され、従来の10倍のスピードとなり、単価も大幅に削減されました。全ゲノムとは、種の細胞内の最初の DNA から最後の DNA までの完全なゲノム配列を分析することを指します。この技術はゲノム内のほぼあらゆる種類の変異を識別することができます。

複雑なものを簡素化:開発のハードルを大幅に下げる

従来のソフトウェア エンジニアの目から見ると、FPGA チップの開発ハードルは非常に高いです。一方では、HDL ハードウェア プログラミングを理解する必要があり、他方では、基盤となるハードウェアとインターフェイスに精通している必要があります。

XDFカンファレンスでは、Alibaba CloudエンジニアのPan Yue氏がSuningプラットフォームソリューションを紹介しました。

まず、「Suning」はC、C++、OpenCLなどの高水準システム言語のサポートを追加しました。これにより、開発者は使い慣れたプログラミング言語やワークフローでスムーズに使用でき、CPUやGPUをベースにした開発をクラウド上のFPGAデバイスに簡単に移植できるようになります。同時に、Alibaba Cloud は、開発者がシステムを迅速に構築できるように、多数のリファレンス デザインと開発パッケージも提供しています。

インターフェースに関しては、「Suntech」はDDR4/5、PCIe、DMAなどを含む統一された標準バスインターフェースを提供します。開発者は何もする必要はなく、内部ロジックの実装(図の灰色の部分)だけに注意を払う必要があります。

さらに、Alibaba Cloud は、さまざまな主流 FPGA 向けの Shell+Role 実装もサポートしており、クロスプラットフォームのマルチブート ソリューションに適応できるため、ユーザーはクロスプラットフォームの移行を簡単に完了できます。

IP暗号化分離: セキュリティに妥協なし

FPGA エコシステムの最も重要な部分として、IP メーカーはクラウド内のマルチテナント環境に非常に関心を持っています。 IP製品が流出しないようにし、ユーザーが購入したIPはユーザー自身だけが使用できるようにする必要があります。

このため、Alibaba Cloud は IP 暗号化、ネットワーク分離、IP 所有権と使用権の分離を採用し、ユーザーのソース コード (または IP ソース コード)、配布パッケージ、展開環境がプロセス全体を通じて第三者から完全に見えなくなるようにします。また、根本的な障害を迅速に認識し、リアルタイムのアラームを生成するヘルス監視機能も提供します。

Suning プラットフォームに最も早く参加した IP プロバイダーの 1 つである CTAccel の CEO である Yu Haile 博士は、次のように述べています。「クラウドに移行した後、セキュリティは当社の最大の関心事です。Alibaba Cloud のセキュリティ分離は非常に優れているため、導入の第一候補として Alibaba Cloud を選択しました。」

変わらない使命:包括的な異種エコシステムを共同で構築する

これまで、アリババクラウドのスローガン「計り知れない価値のために」は常に人々の心に深く根付いており、インクルーシブコンピューティングを積極的に推進してきました。異種コンピューティング依存関係の開始以来、Alibaba Cloud の開発者はより強力な GPU/FPGA インスタンスをより低価格で使用できるようになり、ディープラーニング分野での開発コストが半分以上削減されました。

より多くの開発者がFPGAのメリットを享受できるように、Alibaba CloudはFPGAエラスティッククラウドサーバーを立ち上げ、FPGAイメージ市場を確立しました。これにより、革新的なアイデアと成熟したソリューションを備えたIP製品がプラットフォームを通じて目立つようになり、市場規模が拡大し、研究開発の進歩が加速し、設計の安定性が向上しました。

「サンテックは、アリババクラウドが人工知能産業を実現するための強力なツールです。より多くの開発者がアリババクラウドFPGAエコシステムに参加し、産業における技術の実装を促進することを歓迎します」と張振祥は述べた。

<<:  SAP Smart Cloud Suite は、中原ホームファニシングがホームファニシング業界のデジタル革命をリードするのを支援します

>>:  Kubernetes を監視する際に避けるべき 4 つの落とし穴

推薦する

racknerd: (複数モデル、高構成) 米国独立サーバー サマーセール、月額 189 ドル - AMD Ryzen7 3700X/32G メモリ/1T NVMe/20T トラフィック

Racknerd は、米国の複数のコンピューター ルームでハイエンドの独立型サーバーを販売しています...

Taobao ショップのオーナーは、オンライン ストアのコンバージョン率をどのように向上させることができますか?

現在、タオバオオンラインストアは数え切れないほどあり、すべての店主は自分のオンラインストアが繁栄する...

Weibo はショートビデオ マーケティング キャンペーンに対抗するために何を頼りにしているのでしょうか?

月給5,000~50,000のこれらのプロジェクトはあなたの将来です毎年開催される ROI インター...

7 つの分散型グローバル ID 生成戦略のうち、どれがお好みですか?

マイクロサービスを使用することで、グローバル ID の問題など、もともと単純だった多くの問題が複雑に...

事例分析:WeChatエコシステムのマーケティング価値!

今年8月の人気記事「6年、公会計が運命を変えた」は、春秋文体で公会計の発展に壮大な雰囲気を与えた。実...

経験の共有: 最近のウェブサイトのインデックス低下に関する SEO 分析の概要

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っています今日この記...

独立系ブロガーがすぐに有名ブロガーに成長するための最適な「パスワード」を簡単に分析

独立系ブログといえば、誰もが必ず月光ブログ、陸松松ブログ、牟長青ブログ、Zacブログなど、よく訪問し...

20 を超える Kubernetes クラスターと 400 台のマシンを管理する秘訣は何ですか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

記事の転載は付加価値を付加した場合にのみ価値がある

「コンテンツこそが王様」というのは SEO の世界では永遠に変わらない真実ですが、コンテンツをどのよ...

ファンはいないが、Weiboマーケティングは継続中

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスファンの数は重要ではない...

3 つのステップで成功するクラウド移行計画を構築する方法

クラウド コンピューティングの魅力は、企業のすべてのリソースを一度に移行する必要があることを示唆して...

virpus: シアトルの格安 Windows VPS、超高設定、35% 割引、独立したコンピュータ ルーム

一般的に、Windows VPS は Linux シリーズよりも高価であり、米国西海岸の Windo...

クラウド移行を成功させるための 12 の重要なステップ

多くの企業がさまざまな理由からワークロードをクラウドに移行しています。パブリック クラウドは、ほとん...

ウェブサイト維持戦略とSEO最適化の統一原則

ウェブサイトはどのようにしてユーザーを維持できるのでしょうか。これは非常に奥深いテーマです。私たちは...

Pinduoduo はなぜ次の Alibaba になれないのでしょうか?

私たちは以前、Pinduoduo のビジネスモデルには避けられない欠陥があると主張する記事を書きまし...