クラウドネイティブのビッグデータについて1つの記事で学ぶ

業界の急速な発展とビジネスの高速反復により、データ量も爆発的に増加しました。ビッグデータクラウドネイティブは、企業のデジタル変革にとって徐々に重要な進化の方向性となってきました。デジタル化により、企業は業務効率を向上させ、ビジネスチャンスに対する洞察を得ることができます。クラウドネイティブは IT システムの効率を向上させ、ビジネスの俊敏性を促進します。ビッグデータクラウドネイティブは、企業のイノベーションに無限の可能性をもたらします。

一般的な傾向: クラウドネイティブのビッグデータ

従来のビッグデータアーキテクチャには、リソースの利用、効率的な運用と保守、可観測性などの点で多くの欠点があり、現在の開発ニーズに適応できなくなっています。具体的には、従来のビッグデータアーキテクチャには次のような問題があります。

従来のビッグデータには多数のコンポーネントがあり、インストールとメンテナンスが複雑で、実稼働での使用には多くの人的サポートが必要になります。
オンラインサービスやビッグデータサービスでは独立したリソースプールが使用されるため、リソースの転送が困難になり、使用率が低下し、コストが上昇します。
従来のビッグデータアーキテクチャには CICD メカニズムがなく、テストおよび品質管理プロセスが欠けています。
従来のビッグデータには、高可用性、マルチテナント、ログ記録、監視、アラーム、認識、承認、監査、課金などのすぐに使用できる機能が欠けています。

クラウドネイティブビッグデータは、ビッグデータプラットフォームの次世代アーキテクチャと運用形式です。クラウドネイティブなプラットフォーム展開、クラウドネイティブなコンピューティングスケジューリング、統合されたストレージ負荷を特徴とするビッグデータ処理および分析プラットフォームです。複数のコンピューティング負荷をサポートし、より柔軟なコンピューティングスケジューリングと高いストレージ効率を実現します。クラウドネイティブなビッグデータは、次の3つの観点から、ビッグデータの活用と運用に大きな変化をもたらしています。

ビジネスレベル: 従来のモデルでは、ビジネスは独立してリソースを占有します。ビジネスのピーク時にはすべてのリソースが占有されますが、オフピーク時にはリソースの使用率は 20% ～ 30% にしかならない場合があります。クラウドネイティブモデルでは、オンラインビジネスやオフラインビジネスなどのビジネスが同じ場所に配置され、タイムシェアリング多重化方式でリソースを呼び出すことができます。
リソースのスケジューリング: 従来のモードでは、Flink クラスターに 100 台のマシンがある場合、これらの 100 台のマシンが排他的に使用されます。クラウドネイティブモードは、リソースプールの概念を仮想化します。リソースプールは、Flink クラスターや Spark クラスターなど、さまざまな種類のビッグデータクラスターを実行できます。さらに、これらのクラスターはオンデマンドでプルアップされ、すぐにリサイクルでき、不要になったら解放できます。
統合されたデプロイメントと運用保守インストール: 本来の運用保守方法では、各クラスターが各クラスターの状態を維持する必要があります。クラスター間で遅延や障害が発生すると、問題の場所がより複雑になります。クラウドネイティブには、Helm Chart または Operator の形式で統一された方法でサービスを公開、運用、保守する統合サービス管理インターフェースがあります。これにより、問題が発生した場合、統一されたインターフェースを通じて問題を表示および管理できるようになります。監視アラームログもK8s Pod（プロセス）とNodeのコレクションと統合されます。監視アラームでは、K8s ノードとコンテナの両方、およびサービスの実行ステータスを確認できます。

「3+1」アーキテクチャモデル: 3つの主要プラットフォームと1つの主要サポートシステム

クラウドネイティブビッグデータプラットフォームの機能アーキテクチャは、「3 つの主要プラットフォームと 1 つの主要サポートシステム」として要約できます。 3 つの主要なプラットフォームは、プラットフォームサービス層、コアエンジン層、およびリソーススケジューリング層です。

プラットフォームサービス層はオープンソースコンポーネントプラグインによって統合されており、柔軟な構成と選択をサポートします。
コアエンジン層には、Flink、Spark、クラウドネイティブメッセージングエンジン、リアルタイムサービス分析エンジン、クラウドネイティブログ検索、統合ストレージ HDFS などのコアコンポーネントが含まれており、ストレージとコンピューティングの分離と自動チューニングをサポートします。
リソーススケジューリングレイヤーは、統合コンピューティングリソーススケジューリングと統合エンジンクラウドネイティブライフサイクル管理をサポートします。
主要な支援システムは、オープンソースコンポーネント、サービスライフサイクル、クラスター、災害復旧、可観測性を統合したワンストップ管理プラットフォームである運用保守管理プラットフォームです。

プラットフォームサービス層

プラットフォームサービス層は、オープンソースコンポーネントによってプラグイン方式で統合されており、柔軟に構成および選択することができ、これがプラットフォームアーキテクチャ全体の重要な設計となっています。

既存のユーザー習慣を尊重するために、ユーザーが使い慣れているオープンソースコンポーネントがプラグインの形で統合されています。現在主流のビッグデータの作業シナリオには、主に情報ポータル、データエンジニアリング、データサイエンスが含まれます。それぞれのシナリオには、ユーザーがよく使用するオープンソースコンポーネントが多数あります。

情報ポータル:一般的には、Superset、Apache Ranger などの BI レポートタイプ。
データエンジニアリング:一般的には、ビッグデータ開発エンジニアとデータウェアハウスエンジニアです。データ開発、データ ETL、データ処理、およびクリーニングに使用されるコンポーネントを担当します。たとえば、データ開発には Zeppelin Notebook を使用し、データガバナンスプラットフォームやスケジューリングプラットフォームに接続します。
データサイエンス: Jupyter、Ray などの AI シナリオに一般的に適用可能。

上記の 3 つのシナリオは、ビッグデータの作業では非常に一般的です。クラウドネイティブビッグデータプラットフォームは、これらのオープンソースコンポーネントをプラグイン方式で統合しており、すぐに使用でき、利便性と柔軟性に優れています。

コアエンジン層

コアエンジン層は、ストレージとコンピューティングを分離する特性を持っています。

コンピューティング面では、Flink や Spark などの主流のビッグデータコンピューティングエンジンに加え、クラウドネイティブメッセージングミドルウェア、リアルタイムサービス分析エンジン、クラウドネイティブログ検索サービスを統合しています。

ストレージ面では、HDFS セマンティクスと互換性があり、TOS 透過アクセラレーション、キャッシュアクセラレーション、データレイク管理をサポートする統合ストレージが採用されています。

1. 自動チューニング

クラウドネイティブに向けたビッグデータの開発には、コンピューティングエンジンとクラウドネイティブの深い統合を促進し、自動チューニングに向けて進化することが必要です。私たちの経験から、このプロセスは次の 4 つの段階に分けられます。

• フェーズ 1

￮K8sクラスタの導入と管理

￮アプリケーションはコンテナとイメージを自ら管理する

• フェーズ II

￮リソースプーリング: 基盤となるK8sリソースを認識しない

￮リソースコロケーション: オフラインジョブでのクラスタリソースの共有

￮ジョブリソースの割り当てと並列性のみに焦点を当てる

￮スムーズな進化:YARNとKubernetesジョブの共存

• フェーズ3

￮仮想キュー:クラスターやコンピュータルーム間でのジョブの自動スケジュールをサポート

￮アイドルリソースを活用する:過剰発行と排除メカニズムを通じてアイドルリソースを活用する

￮半自動エンジンチューニング:インテリジェントチームを使用してタスク構成パラメータを推奨し、手動で確認して発行します。

• 第4段階（現在の最終目標でもある）

￮グローバル自動災害復旧：コンピュータルーム全体にわたる自動スケジュールと災害復旧を実現

￮自動リソース最適化：負荷がない場合、リソース使用量を 0 に減らすことができます。ミリ秒レベルのコールドスタート遅延

￮エンジン自動チューニング： AI技術を使わず、コンピューティングネットワークやメモリなどのリソースの使用を最適化するハイブリッド

2. ストレージとコンピューティングの分離

クラウドネイティブの具体的な作業は、主に次の 3 つの部分で構成されます。

統合管理とスケジュール:

• データ権限を統一し、セキュリティリスクを軽減する: リソースプールにはデータが含まれており、セキュリティリスクを軽減するために権限とセキュリティ管理を統一する必要があります。

• 統一されたリソースのスケジュールと再利用: リソースプールでは、統一されたリソースのスケジュールと再利用も必要です。例えば、ストレージを統合した後は、異なる業務で再利用する際にも統合スケジューリングを行うことができます。

ストレージ容量の共有:

• データのコピーを統一し、データのアンロードを削減します。データタスクは失敗することが多く、同期によってリソースが消費されます。タスク同期エラーが発生した場合、その原因の特定が困難で、非常に手間がかかるため、データのアンロードは可能な限り削減する必要があります。

• 高い信頼性要件を満たす統合データ災害復旧: 複数のストレージとコンピューティングの分離展開形式をサポートします。コンピューティングとストレージの 2 つのクラスターに完全に分割することも、コンピューティングとストレージを K8s クラスター上で混在させることもできますが、この場合はコンピューティングとストレージは別々に管理されます。

ストレージとコンピューティングの分離負荷:

• スケールアップ、スケールダウン、データの再バランス調整にかかる時間を短縮: クラウドネイティブのデータレイク、データウェアハウス、メッセージキュー、検索エンジンがストレージとコンピューティングの分離の展開モードをサポートしている場合、ストレージを統合されたビッグデータファイルストレージまたはオブジェクトストレージに配置できるため、スケールアップ、スケールダウン、データの再バランス調整にかかる時間を短縮できます。

• 要求応答性の強化: 統合ビッグデータファイルストレージまたはオブジェクトストレージにストレージを配置すると、要求応答性も強化されます。

リソーススケジューリングレイヤー

リソーススケジューリングレイヤーは、主にコンピューティングリソーススケジューリングとエンジンクラウドネイティブライフサイクル管理を統合するために使用されます。次の 4 つのモジュールが含まれます。

•マルチクラウドの展開とスケジュール設定: クロスクラウドのクォータ管理 (統合クォータ) を提供し、高可用性を実現します。

• 統合リソースプール: 統合負荷の計算をサポートし、オフラインコロケーションをサポートします。

• クラウドネイティブ YARN: YARN リソースロードと互換性があり、既存の Hadoop ロードをスムーズに移行します。

•クラウドネイティブオペレーター: Helm Chart を使用して、エンジン全体のクラウドネイティブライフサイクルを管理します。

従来のリソーススケジューリングシステムをクラウドネイティブに進化させるには、2 つの並行した方法があります。次の 2 つのいずれかを選択できます。

•サーバーレス YARN: 上の図からわかるように、リソースマネージャー、ノードマネージャー、アプリケーションマスターは YARN の 3 つの主要コンポーネントです。このソリューションはリソースマネージャーで変更され、新しいコンポーネントが追加されます。この変換後、お客様にとって、新しいシステムは YARN クライアントを介してジョブを送信する使用方法を引き続き維持しますが、リソースマネージャーレイヤーでそれらをカプセル化してスケジュールし、ユーザーが API サーバー (実際には K8s API サーバー) に直接ジョブを送信できるようにします。つまり、YARN のリソースマネージャーを変革することで、もともと YARN を使用してリソース要求を送信していた企業は、K8s にビジネスをスムーズに送信できるようになります。

•クラウドネイティブオペレーター: このソリューションは、既存のビッグデータコンポーネントをクラウドネイティブに展開し、Flink や Spark などのコンピューティングエンジンをクラウドネイティブ方式で K8s に展開するためのものです。このソリューションには 2 つの利点があります。 1 つ目は、オペレーターを使用してコンピューティングエンジンをそのライフサイクル全体にわたって管理できるため、ユーザーはより優れたバッチジョブの再起動戦略を実装できるようになります。 2 つ目は、クラウドネイティブと K8s がより適切に統合されていることです。 Pod 上のログをより細かく収集し、ビッグデータエンジン全体とジョブの実行状態を追跡できます。

統合リソースプール（左）クラスター間、コンピュータルーム間、リージョン間をサポートするグローバルリソースレイク (右)

スケジュールレベルでは、クラウドネイティブを実現するために次の 2 つのことを行う必要があります。

1. 統合リソースプール

仮想リソースプールの概念には、次のような基本的な要件が必要であると考えています。

• キューのプロパティ: リソースプールの最小値と最大値のプロパティを設定する

• より強力なスケジューリング戦略: タスク優先度スケジューリング、GANG スケジューリング、DRF スケジューリング (GANG スケジューリング戦略では、ジョブのすべてのコンテナが一緒にスケジュールされ、DRF アルゴリズムでは、リソースプール内の各ジョブにリソースが公平に割り当てられます)

• より優れた分離制御: 各ポッドのCPUタイムスライスとメモリ使用量を制限

•より柔軟なリソース使用：アイドルリソースの利用とキューのプリエンプション

2. グローバルリソースレイク

•ResLakeは、リソース、グローバルリソースプール、クォータ管理のグローバルビューを備えています。

• コンピュータルームやクラスタに制限はなく、最終的なスケジュール目標はリソースの利用を最適化することです。

たとえば、現在、クラスター A にリソースプールがあり、クラスター B にリソースプールがあります。災害復旧の要件を満たすために、これらの 2 つのリソースプールをプライマリリソースプールとバックアップリソースプールとして使用し、仮想キューの概念を抽象化することができます。このように、タスクを送信するときに、ユーザーはリソースプールに注意を払う必要はなく、仮想キューに送信するだけで済みます。クラスタA/コンピュータ室に割り当てるか、クラスタB/コンピュータ室に割り当てるかは、以下のクラスタ/コンピュータ室の稼働状況に応じて自動的に決定されます。

運用保守管理プラットフォーム

オープンソースコンポーネント、サービスライフサイクル、クラスタリング、ディザスタリカバリ、および可観測性を統合したワンストップ管理プラットフォーム。

ビッグデータプラットフォームには、可観測性、オープンソースコンポーネント管理、サービスライフサイクル管理、クラスター管理、災害復旧管理の機能とサービスが必要です。図中の青い部分は、クラウドネイティブコンピューティング向けに特別に強化されています。詳細な説明は次のとおりです。

•フルリンク監視：コールチェーン、コール関係などを含むリンク全体で各サービスの実行状態を監視できるため、障害が発生した場合に問題のある特定のコールリンクを特定できます。

•オープンソースコンポーネント管理: Helm Chart を通じてコンポーネントをデプロイし、起動、終了、クリーンアップなどの一連の操作を含む実行中のコンポーネントのライフサイクル全体を Operator を通じて管理します。したがって、オープンソースコンポーネント管理は、エンジンや特定のオープンソースコンポーネント、さらには K8s プラットフォーム上のタスクを管理するための特別なモードです。このモードの利点は、より高速で、よりきめ細かいことです。

•サービスライフサイクル管理: 統合されたビジュアル管理インターフェイスを通じて、サービスコンポーネントのレンダリング、公開、およびステータス管理サービスを提供します。

•クラスター管理：クラスターの拡大・縮小やクラスター情報の統計に加え、ジョブ全体の実行状況やサービスの実行状況をより適切に監視するために、コンテナログをより細かく収集する必要がある場合が多いため、この部分を強化しました。また、コンテナの実行状況を把握するために、Web Shell 経由で Pod にログインし、コマンドライン形式で Linux の指示を入力し、ローカル端末上でリモートサーバーを操作するのと同様に、ブラウザ上でジョブ実行環境を直接操作できるサービスを提供しています。これは、ジョブの開発と問題の特定に非常に実用的なツールです。

コスト削減と効率改善：ユーザーシナリオと価値

ハイブリッド展開によりリソース利用率が向上

ハイブリッドユーザーシナリオでは、クラウドネイティブビッグデータプラットフォームは、オンライン、ストリーミング、オフライン、クエリ分析、バッチ処理など、さまざまなビジネスシナリオをサポートします。

ビジネスシナリオが異なれば、基盤となるリソースの応答に関するコア指標も異なるため、基盤となるリソースの最適化要件も異なります。これらのさまざまなシナリオのビジネス指標の要件を満たすには、コロケーション中に対応する最適化に重点を置く必要があります。コロケーションの典型的なシナリオを 2 つ示します。

1. Flink と Spark の共存。つまり、Flink がリソースを使用しない場合や負荷が低い場合は、リソースを Spark に解放することができます。 Spark がバッチコンピューティングを完了すると、アイドルリソースをストリーミングコンピューティング (Flink) に解放することもできます。

2. APP リアルタイム呼び出しとビッグデータシナリオの混合展開。上の図に記載されている 5 つのシナリオのうち、右側の 4 つはビッグデータシナリオです。ビッグデータシナリオでは、APP リアルタイム呼び出しシナリオでリソースを再利用できます。つまり、APP のオンラインリソース使用量が少ない場合は、ビッグデータシナリオに解放することができ、その逆も同様です。

ByteDance を例にとると、さまざまなコンピューティングリソースを組み合わせて展開およびスケジュール設定することで、顕著なメリットが得られました。

1 つ目は効率的なリソース切り替えで、数分以内に数万のオフラインリソースを解放できます。例えば、2022年の春節期間中、Douyinのオンラインリソースの需要は非常に高く、数分以内に数十万コアのオフラインリソースをオンラインリソースに割り当てました。突然のソーシャルホットスポットによって極端に弾力性のあるシナリオが発生した場合、効率的なリソースの切り替えは、ビジネスにとって「命を救う武器」となることさえあります。
2つ目は利用率の向上です。コロケーションにより、全体的なパブリックオーバーヘッドを削減でき、 ByteDance 内での利用率が 2% 向上しました。
最後に、オフラインリソースの統合管理とすべてのオフラインリソースの共有により、割り当て制御、スケジュール、操作、および機械の操作とメンテナンスを統合できます。

マルチクラウド展開により、マルチクラウドコストの最適な再利用が実現

マルチクラウドユーザーシナリオでは、マルチクラウドの展開とスケジュール設定を提供して、マルチクラウドのコストを最適化した再利用とクロスクラウドキューの災害復旧を実現できます。

グローバル仮想キューの提供: ユーザーが複数のクラウドを使用する場合、まずグローバル仮想キューの概念を提供する必要があります。上の図に示すように、仮想キューは 2 つの異なる物理リソースプールに対応するリソースプールです。送信時に、ユーザーは実際の対応するクラスターに注意を払う必要はなく、代わりに仮想キューに送信します。下位層はそれに応じてジョブをスケジュールし、適切なクラスター/コンピュータールーム/キューに自動的に配布するため、災害復旧機能が効果的に向上します。
アプリケーションは複数の要素に基づいてトラフィック分散を選択します。マルチクラウド展開のもう 1 つの利点は、複数の要素を総合的に考慮してトラフィック分散を選択できることです。たとえば、マルチクラウドのシナリオでは、AZ1 はメーカー 1、AZ2 はメーカー 2 であると理解されます。ここで、同じ数の CU を使用すると、メーカー 2 の方がメーカー 1 よりも 50% コストが高くなることがわかります。この場合、マルチクラウドスケジューリングを使用して、トラフィックを可能な限りメーカー 1 に分散できます。これはコストの観点から考慮された状況です。もちろん、コストは削減されるものの、ダウンタイムが頻繁に発生したり、応答時間が長くなったり、タスクステータスのエラー率が高くなったりする状況も考えられます。この場合、重要なアプリケーションをあらゆる面でより優れた指標を備えたコンピュータルームに配置する必要があります。一般的に、トラフィックの配分は複数の要素を総合的に考慮して行われます。マルチクラウド展開シナリオでは、ユーザーがマルチクラウドコストを最適に再利用できるように支援します。

著者について: Chi Hui

Volcano Engine Cloud Native Computing のプロダクトエキスパートとして、Volcano Engine Cloud Native Big Data Platform 関連のプロダクト業務を担当しており、ビッグデータ開発プラットフォームおよびビッグデータガバナンスプラットフォームにおける長年のプロダクト経験を持っています。

<<: IDC: コンピューティングおよびストレージクラウドインフラストラクチャの支出は、2022年第3四半期も引き続き大幅に増加

>>: Java クラウドネイティブの実践におけるメモリの問題の解釈