Alibaba ビッグデータ クラウドネイティブプラクティス、EMR Spark on ACK 製品紹介

Alibaba ビッグデータ クラウドネイティブプラクティス、EMR Spark on ACK 製品紹介

1. クラウドネイティブの課題とAlibabaの実践

ビッグデータ技術開発動向

クラウドネイティブの課題

コンピューティングとストレージの分離

オブジェクトストレージをベースにしたHCFSファイルシステムの構築方法

既存のHDFSと完全に互換性があります
HDFSに匹敵するパフォーマンスを低コストで実現

シャッフルストレージとコンピューティングの分離

ACKハイブリッド異種モデルの問題を解決する方法

異種モデルにはローカル ディスクがありません。コミュニティ [Spark-25299] では、Spark の動的リソースについて議論およびサポートが行われ、業界のコンセンサスとなりました。

キャッシュソリューション

クロスコンピュータルームとクロス専用線ハイブリッドクラウドを効果的にサポートする方法

コンテナ内のキャッシュシステムをサポートする必要がある

ACK スケジューリング

スケジューリングパフォーマンスのボトルネックを解決する方法

パフォーマンスベンチマークYarn
マルチレベルキュー管理

他の

ピークシフトスケジュール
Yarnon ACKノードリソース相互認識

Alibaba Practice - ACK 上の EMR

全体的なソリューションの紹介

データ開発クラスター/スケジューリング プラットフォームを介してさまざまな実行プラットフォームに送信し、段階的なスケジューリングを行い、ビジネスのピークとオフピークの戦略に応じてクラウド ネイティブ データ レイク アーキテクチャを調整します。ACK は強力な弾力的な拡張および縮小機能を備えており、専用回線を使用してクラウド内外でハイブリッド スケジューリングを実行します。
ACKは優れた柔軟性で異種クラスタを管理します

2. Sparkコンテナ化ソリューション

ソリューションの紹介

RSS よくある質問

1. リモートシャッフルサービスが必要な理由は何ですか?

RSS を使用すると、Spark ジョブで Executor Pod にクラウド ディスクをマウントする必要がなくなります。クラウド ディスクをマウントすることは、スケーラビリティと大規模な生産慣行には役立ちません。
クラウド ディスクのサイズを事前に決定することはできません。大きすぎるとスペースが無駄になります。小さすぎると、シャッフルは失敗します。 RSS は、ストレージとコンピューティングの分離シナリオ向けに特別に設計されています。
Executor は、シャッフル データの管理を担当する RSS システムにシャッフル データを書き込みます。 Executor はアイドル状態のときにリサイクルできます。 [スパーク-25299]
動的リソースを完全にサポートし、データ偏りのあるロングテール タスクが Executor リソースを保持して解放されないようにすることを防ぎます。
2. RSS のパフォーマンス、コスト、スケーラビリティはどの程度ですか?

RSS はシャッフルに対して高度な最適化が施されており、ストレージとコンピューティングの分離シナリオや K8s のエラスティック シナリオ向けに特別に設計されています。
Shufflefetch ステージでは、reduce ステージでのランダム読み取りをシーケンシャル読み取りに変換できるため、ジョブの安定性とパフォーマンスが大幅に向上します。
シャッフル用にクラウド ディスクを追加することなく、元の K8s クラスター内のディスクを直接デプロイに使用できます。コスト効率が非常に高く、導入方法も柔軟です。

スパークシャッフル

numMapper * numReducerブロックを生成する
連続書き込みおよびランダム読み取り書き込み中の流出
単一レプリカ、データ損失にはステージの再計算が必要

EMR リモートシャッフルサービス

追加書き込みおよび書き込みなしの順次読み取り時のスピル
2部;コピーがメモリにコピーされると、そのコピーはパブリックネットワーク帯域幅を必要とせずにイントラネット経由でバックアップされます。

RSS TeraSort ベンチマーク

注: 10T Terasort を例にとると、圧縮後のシャッフル ボリュームは約 5.6T になります。 RSS シナリオでは、シャッフル読み取りがシーケンシャル読み取りに変更されるため、この規模のジョブのパフォーマンスが大幅に向上することがわかります。

ECI効果のスパーク

まとめ

<<:  配布中の地域的な問題により、300ラウンドの戦いに至った

>>:  クラウドテクノロジー|ハイブリッドクラウド管理プラットフォームのマルチリージョンアーキテクチャ

推薦する

マーケティングのジレンマ:Sina Weibo のマーケティングの悩み

新浪微博でわずか24時間以内に何万回も転送され、1,000件のコメントが付けられたマーケティング微博...

クラウドコンピューティング市場はどこへ向かうのでしょうか?

現在は、世界的に情報技術が爆発的に進歩し、国内でも産業が高度化している重要な時期にあります。社会全体...

調査によると、ITプロフェッショナルのうちクラウドネイティブセキュリティを理解しているのはわずか13.5%

オープンソース ソフトウェア プロジェクトの開発者である Canonical は最近、クラウド ネイ...

検索エンジンプラットフォームの利点をプロモーションに正しく活用する方法

検索エンジンのトレンドとして、現在使用している人の数は非常に多く、その影響力は大きいです。SEO担当...

変な男に襲われた後、私の肛門は2日間「言葉では言い表せない」状態になりました!

上の写真のような菊のステッカーをプレゼントしたいと思います。去年時計を買ったんです!ここ二日間、私は...

Kubernetesの権限管理に関する徹底的な議論

Kubernetes は主に API サーバーを通じて外部サービスを提供します。このようなシステムで...

maple-hosting: オランダの反苦情および著作権フリーの専用サーバー、月額 248 ドル、2*e5-2650/128g メモリ/8T ハードディスク/1Gbps 専用帯域幅

Maple-hostingは、クレームに強く、著作権を無視する業界で有名なサーバー商人です。主にオラ...

ファーウェイクラウド 洪方明:一緒にインテリジェントシティを構築し、都市をより温かくする

この街は夢のようで、想像できるものはすべて夢に見ることができる...これはイタリアの作家カルヴィーノ...

ウェブサイト最適化におけるマシュー効果

マシュー効果とは、良いものはさらに良くなり、悪いものはさらに悪くなり、より多くのものはさらに増え、よ...

App Store SEO と App Store ASO の違いは何ですか?

ASO (「 App Store最適化」)は、アプリ ストアを最適化することでアプリのダウンロード数...

Aiti Tribe Clinic 第 17 回: 分散トランザクション処理とフロントエンドとバックエンドの分離のデプロイメントの問題

活動の説明: Aiti Tribe は、コア開発者に詳細な技術交流、開発ニーズへのソリューション、リ...

ローカルウェブサイトの開発が難しい根本的な理由とその解決策

インターネットの急速な普及と、総合から細分化、全国市場から地域市場への急速な拡大に伴い、地域のインタ...

オンライン薬局は偽物や偽物が多く、本物と偽物の区別がつきにくい。度重なる禁止措置にもかかわらず、偽サイトは横行している。

3月15日の前夜、ライジングが最近発表したテストデータは、オンラインで医薬品を購入することのリスクを...

SEOデータ分析、百度スナップショットがリード

ウェブサイトの SEO 担当者として、ウェブサイトの SEO データを分析する方法を学ぶ必要がありま...

クラウド コンピューティングによりデータ センターの仕事がなくなるでしょうか?

クラウド コンピューティングによってデータ センターの雇用が減少するかどうかは、2005 年に Ca...