Argo Rollouts は、Kubernetes Operator 実装であり、ブルーグリーン、カナリア、カナリア分析、実験、プログレッシブ配信機能など、Kubernetes のより高度なデプロイメント機能を提供し、クラウドネイティブのアプリケーションとサービスに対して自動化された GitOps ベースのプログレッシブ配信を可能にします。 次の機能がサポートされています:
実施原則Deployment オブジェクトと同様に、Argo Rollouts コントローラーは、Deployment オブジェクトと同じポッド テンプレートを使用して、Rollout リソースの spec.template で定義された ReplicaSets の作成、スケーリング、および削除を管理します。 spec.template が変更されると、新しい ReplicaSet が導入されていることが Argo Rollouts コントローラーに通知されます。コントローラーは、spec.strategy フィールドの戦略を使用して、古い ReplicaSet から新しい ReplicaSet へのロールアウトをどのように進めるかを決定します。この新しいレプリカセットがスケールアップされると (オプションで分析経由)、コントローラーはそれを安定しているとマークします。 spec.template を安定した ReplicaSet から新しい ReplicaSet に移行中に別の変更が発生した場合 (つまり、リリース中にアプリケーションのバージョンが変更された場合)、以前の新しい ReplicaSet は縮小され、コントローラーは更新された spec.template フィールドを反映した ReplicaSet をリリースしようとします。 関連概念先に進む前に、いくつかの基本的な概念を理解しましょう。 ロールアウトするRollout は、Kubernetes Deployment オブジェクトと同等の Kubernetes CRD リソースです。より高度なデプロイメント機能またはプログレッシブ配信機能が必要な場合に、デプロイメント オブジェクトを置き換えることを目的としています。 Rollout は、Kubernetes Deployment では提供できない機能を提供します。
プログレッシブデリバリープログレッシブ配信は、製品のアップデートを制御された段階的な方法でリリースするプロセスであり、これによりリリースのリスクが軽減され、多くの場合、自動化とメトリック分析を組み合わせて、アップデートの自動アップグレードまたはロールバックが実行されます。 プログレッシブ デリバリーは、継続的デリバリーの進化形として説明されることが多く、CI/CD のスピードの利点をデプロイメント プロセスに拡張します。新しいバージョンを一部のユーザーに限定し、正しい動作を観察および分析し、その正確性を継続的に検証しながら徐々にトラフィックを増やします。 展開戦略業界ではさまざまな展開戦略を説明するために一貫した用語を使用していますが、これらの戦略の実装はツールごとに異なることがよくあります。 Argo Rollouts の動作を明確にするために、以下では Argo Rollouts が提供するさまざまなデプロイメント戦略の実装について説明します。
上の画像は、2 つのステージ (トラフィックの 10% と 33% が新しいバージョンに送られる) を持つカナリアを示しています。 Argo Rollouts を使用すると、実際の使用状況に基づいてステージ数とトラフィックの割合を正確に定義できます。 建築以下は、Argo Rollouts によって管理されるデプロイメントのすべてのコンポーネントを示しています。 ロールアウトコントローラこれは、クラスターのイベントを監視し、ロールアウト タイプのリソースが変更されたときに反応するメイン コントローラーです。コントローラーはロールアウトのすべての詳細を読み取り、クラスターをロールアウト定義で説明されているのと同じ状態にします。 Argo Rollouts は、通常のデプロイメント リソースに加えられた変更を改ざんしたり、それに応答したりしないことに注意してください。つまり、他の方法を使用してアプリケーションをデプロイするクラスターに Argo Rollouts をインストールできます。 ロールアウトリソースRollout リソースは、Argo Rollouts によって導入および管理されるカスタム Kubernetes リソースです。基本的にはネイティブの Kubernetes Deployment リソースと互換性がありますが、カナリアやブルー/グリーン デプロイメントなどのより高度なデプロイメント方法を制御するための追加フィールドがあります。 Argo Rollouts コントローラーは、Rollout リソースの変更にのみ反応し、通常の Deployment リソースに対しては何も行いません。そのため、Argo Rollouts を使用して Deployment を管理する場合は、Deployment を Rollouts に移行する必要があります。 古いレプリカセットと新しいレプリカセットこれらは標準の Kubernetes ReplicaSet リソースのインスタンスであり、Argo Rollouts はアプリケーションに属するさまざまなバージョンを追跡するために、追加のメタデータを追加します。 また、ロールアウトに参加しているレプリカセットはコントローラーによって完全に自動的に管理されるため、外部ツールで改ざんしてはならないことにも注意してください。 イングレス/サービスユーザー トラフィックがクラスターに入ると、適切なバージョンにリダイレクトされます。 Argo Rollouts は標準の Kubernetes サービス リソースを使用しますが、いくつかの追加のメタデータを使用します。 Argo Rollouts はネットワーク構成において非常に柔軟です。まず、ロールアウト中にさまざまなサービスを使用できます。これは、新しいバージョンのみ、古いバージョンのみ、または両方に適用できます。特に Canary デプロイメントの場合、Argo Rollouts は、ポッドの数に基づく単純な構成ではなく、特定の割合でトラフィックを分割するための複数のサービス メッシュおよび Ingress ソリューションをサポートします。 分析と分析実行分析は、ロールアウトをメトリック プロバイダーに接続し、ロールアウトが成功したかどうかを判断する特定のメトリックの特定のしきい値を定義するカスタム Kubernetes リソースです。分析ごとに、1 つ以上のインジケーター クエリとその予想される結果を定義できます。インジケータクエリが正常であれば、ロールアウトは引き続き動作します。インジケータが失敗を示した場合、自動的にロールバックされます。インジケータが成功/失敗の回答を提供できない場合、リリースは中断されます。 分析は、クエリするメトリックの単なるテンプレートです。ロールアウトに添付された実際の結果は AnalysisRun カスタム リソースであり、特定のロールアウトで分析を定義したり、クラスター上でグローバルに分析を定義して複数のロールアウトで共有したりできます。 ロールアウトでの分析とメトリックの使用は完全にオプションであり、API または CLI を介して手動でリリースを一時停止および促進したり、他の外部メソッドを使用したりできることに注意してください。 Argo Rollouts のメトリクス ソリューションのみを使用する必要はなく、ロールアウトで自動 (分析ベース) のステップと手動のステップを混在させることもできます。 メトリックに加えて、Kubernetes ジョブを実行したり、Webhook を実行したりして、リリースの成功を判断することもできます。 メトリックプロバイダーArgo Rollouts には、リリースを自動的に昇格またはロールバックするために分析リソースで使用できる、いくつかの一般的なメトリック プロバイダーとのネイティブ統合が含まれています。 CLI と UIロールアウトは、Argo Rollouts CLI または統合 UI を使用して表示および管理することもできます (どちらもオプション)。 インストール次のコマンドを使用して Argo Rollouts をインストールするだけです。 $ kubectl 名前空間 argo-rollouts を作成します ここで argo-rollouts という名前空間が作成され、その下で Argo Rollouts コントローラーが実行されます。 $ kubectl get pods -n argo-rollouts さらに、コマンドライン管理とビジュアルリリースに非常に便利な kubectl プラグインをインストールすることもできます。 curl を使用して Argo Rollouts kubectl プラグインをインストールします。 # https://github.91chi.fun/https://github.com//argoproj/argo-rollouts/releases/download/v1.2.2/kubectl-argo-rollouts-linux-amd64 次に、kubectl-argo-rollouts バイナリ実行権限を付与します。 $ chmod +x ./kubectl-argo-rollouts-linux-amd64 バイナリを PATH に移動します。 $ sudo mv ./kubectl-argo-rollouts-linux-amd64 /usr/local/bin/kubectl-argo-rollouts プラグインが正常にインストールされたことを確認するには、次のコマンドを実行します。 $ kubectl argo ロールアウト バージョン 使用次に、いくつかの簡単な例を使用して、Rollout の展開、アップグレード、リリース、中断を説明し、Rollout のさまざまな機能を紹介します。 1. ロールアウトを展開する まず、ロールアウト リソースとリソース用の Kubernetes サービス オブジェクトをデプロイします。この例のロールアウトでは、カナリア更新戦略を採用し、トラフィックの 20% をカナリアに送信し、その後手動で解放し、最後にアップグレードの残りの時間中にトラフィックを徐々に自動的に増加させます。この戦略は、次のロールアウトで説明できます。 # 基本的なロールアウト.yaml 以下に示すように、サービス リソース オブジェクトも含まれます。 # 基本サービス.yaml 上記の 2 つのリソース オブジェクトを直接作成します。 $ kubectl apply -f 基本的なロールアウト.yaml ロールアウトの最初の作成では、アップグレードがまだ行われていないため、レプリカがすぐに 100% にスケーリングされます (カナリア アップグレードの手順、分析などはスキップされます)。 $ kubectl ポッドを取得 -l app=rollouts-demo Argo Rollouts kubectl プラグインを使用すると、Rollout と関連リソース オブジェクトを視覚化し、リアルタイムのステータスの変化を表示できます。デプロイメント プロセス中にロールアウトを監視するには、プラグインの get rollout --watch コマンドを実行します。次に例を示します。 $ kubectl argo rollouts ロールアウトを取得します rollouts-demo --watch 2. アップデートのロールアウト 展開が完了しました。次に、更新する必要があります。デプロイメントと同様に、Pod テンプレート フィールドに変更を加えると、新しいバージョン (ReplicaSet) がデプロイされます。ロールアウトを更新するには、通常、コンテナ イメージのバージョンを変更してから、 kubectl apply を実行する必要があります。利便性のために、ロールアウト プラグインは別の set image コマンドも提供します。たとえば、ここでは次のコマンドを実行して、上記のロールアウトをコンテナの黄色バージョンで更新します。 $ kubectl argo rollouts set image rollouts-demo \ ロールアウト更新中、コントローラはロールアウト更新戦略で定義された手順を実行します。この例のロールアウトでは、カナリアに 20% のトラフィック ウェイトを設定し、ユーザーがリリースをキャンセルまたは促進するまでロールアウトを一時停止します。画像を更新した後、一時停止状態になるまでロールアウトを再度確認します。 $ kubectl argo rollouts ロールアウトを取得します rollouts-demo --watch デモ ロールアウトが 2 番目のステップに到達すると、ロールアウトが一時停止され、5 つのレプリカのうち 1 つがポッドの新しいバージョンを実行しているのに対し、残りの 4 つは古いバージョンをまだ実行していることがプラグインからわかります。これは、setWeight: 20 ステップで定義された 20% のカナリア ウェイトに相当します。 3. ロールアウトを促進する 上記の更新後、ロールアウトは一時停止状態になり、ロールアウトが期間のない一時停止ステップに達すると、再開/昇格されるまで一時停止状態のままになります。ロールアウトを手動で次のステップに切り替えるには、プラグインのプロモーション コマンドを実行します。 $ kubectl argo ロールアウト ロールアウトデモをプロモートする 切り替え後、Rollout は残りの手順を引き続き実行します。私たちの場合、残りの手順は完全に自動化されているため、Rollout は最終的に新しいバージョンに完全に移行するまで手順を完了します。すべてのステップが完了するまで、ロールアウトを再度監視します。 $ kubectl argo rollouts ロールアウトを取得します rollouts-demo --watch
安定バージョンがリビジョン:2 の ReplicaSet に切り替わったことがわかります。カナリア分析の失敗によって自動的に、またはユーザーによって手動で更新が中止された場合、Rollout は安定バージョンにフォールバックします。 4. 割り込みロールアウト次に、更新中にロールアウトを手動で中止する方法を見てみましょう。まず、set image コマンドを使用してコンテナの新しい red バージョンをデプロイし、ロールアウトが再び一時停止ステップに到達するまで待機します。 $ kubectl argo rollouts set image rollouts-demo \ 今回は、ロールアウトを次のステップに切り替えるのではなく、更新を中止して安定バージョンに戻します。プラグインには、更新プロセス中にいつでもロールアウトを手動で中止するための中止コマンドも用意されています。 $ kubectl argo ロールアウトを中止して、ロールアウト デモを実行します。 ロールが中止されると、レプリカセットの安定バージョン (この場合は黄色のバージョン) がスケールアップされ、他のバージョンはスケールダウンされます。レプリカセットの安定バージョンが実行中で正常であっても、期待されるバージョン (赤色のバージョン) が実際に実行されているバージョンではないため、ロールアウト全体は依然として劣化していると見なされます。 Rollout が壊れたバージョンではなく再び正常なバージョンと見なされるためには、目的の状態を以前の安定したバージョンに戻す必要があります。この場合は、以前の黄色のイメージを使用して、set image コマンドを再実行するだけです。 $ kubectl argo rollouts set image rollouts-demo \ このコマンドを実行すると、ロールアウトがすぐに正常になり、新しいレプリカセットを作成するアクティビティがないことがわかります。 ロールアウトがまだ期待された状態に達していない場合 (中止された、または更新中の場合など)、リソース マニフェストの安定したバージョンが再適用されると、ロールアウトはこれが更新ではなくロールバックであることを検出し、分析と手順をスキップして安定したレプリカセットを迅速にデプロイします。 上記の例のロールアウトでは、トラフィックを制御するために Ingress コントローラまたはサービス メッシュは使用されません。代わりに、通常の Kubernetes サービスを使用して、新しいレプリカと古いレプリカの数の比率に基づいて、おおよそのカナリア ウェイトを実装します。したがって、このロールアウトには、5 つのポッドのうち 1 つをスケーリングして新しいバージョンを実行することによって、最小の重みを 20% しか達成できないという制限があります。よりきめ細かいカナリアを実装するには、Ingress コントローラーまたはサービス メッシュが必要です。 ダッシュボードArgo Rollouts Kubectl プラグインは、ロールアウトを視覚化するためのローカル ダッシュボードを提供します。 ダッシュボードを起動するには、Rollouts リソース オブジェクトを含む名前空間で kubectl argo rollouts dashboard コマンドを実行し、localhost:3100 にアクセスします。 「ロールアウト」をクリックすると詳細ページに移動し、ロールアウトの構成情報を確認したり、再起動、リブート、中断などの一般的な操作を UI インターフェイスで直接実行したりできます。 分析と漸進的な相互作用Argo Rollouts は、段階的な配信を推進するための分析を実行するためのいくつかの方法を提供します。まず、いくつかの CRD リソースを理解する必要があります。
背景分析カナリアがデプロイメント手順を実行している間、分析はバックグラウンドで実行できます。 次の例では、カナリアの重みが 100% に達するまで、10 分ごとに 20% ずつ徐々に増加します。バックグラウンドでは、 success-rate という名前の AnalysisTemplate に基づいて AnalysisRun が開始され、Prometheus サーバーにクエリを実行して、5 分間隔/サンプルで HTTP 成功率を測定します。終了時間はなく、停止されるか失敗するまで継続します。測定されたメトリックが 95% 未満で、そのような測定値が 3 つあった場合、分析は失敗と見なされました。分析が失敗するとロールアウトが中止され、カナリアの重みはゼロに戻され、ロールアウトは劣化したものとみなされます。それ以外の場合、ロールアウトがすべてのカナリア ステップを完了すると、ロールアウトは成功したと見なされ、コントローラーは分析の実行を停止します。 Rollout リソース オブジェクトは次のとおりです。 apiバージョン: argoproj.io/v1alpha1 上記では成功率テンプレートを引用しました。 apiバージョン: argoproj.io/v1alpha1 インライン分析分析は、インラインの「分析」ステップとして実行することもできます。分析が「インライン」で実行される場合、そのステップに到達すると AnalysisRun が開始され、実行が完了するまで先に進むことがブロックされます。分析実行の成功または失敗によって、デプロイメントが次のステップに進むか、デプロイメントが完全に中止されるかが決まります。 以下に示す例では、カナリアの重みを 20% に設定し、5 分間一時停止してから分析を実行します。分析が成功した場合はロールアウトが続行され、失敗した場合は中止されます。 apiバージョン: argoproj.io/v1alpha1 上記のオブジェクトでは、分析をロールアウト ステップのステップとしてインライン化します。トラフィックの 20% が 5 分間停止すると、成功率分析テンプレートが実行されます。 ここでの AnalysisTemplate は上記のバックグラウンド分析の例と同じですが、間隔が指定されていないため、分析は 1 回実行されて完了します。 apiバージョン: argoproj.io/v1alpha1 さらに、カウント フィールドと間隔フィールドを指定することで、より長い期間にわたって複数の測定を実行することもできます。 メトリクス: 複数のテンプレートの分析Rollout は、AnalysisRun を構築するときに複数の AnalysisTemplates を参照できます。この方法では、複数の AnalysisTemplates から分析を作成できます。複数のテンプレートが参照されている場合、コントローラーはそれらを結合します。コントローラーは、すべてのテンプレートの metrics フィールドと args フィールドを結合します。以下のように表示されます。 apiバージョン: argoproj.io/v1alpha1 分析を実行すると、コントローラーは成功率テンプレートとエラー率テンプレートを AnalysisRun オブジェクトにマージします。 以下の状況が発生した場合、コントローラーはテンプレートのマージに失敗することに注意してください。
テンプレートパラメータの解析AnalysisTemplates は、ロールアウトによって渡すことができる一連のパラメータを宣言できます。これらのパラメータは、メトリック構成と同様に使用でき、AnalysisRun の作成時にインスタンス化されます。パラメータ プレースホルダは、以下に示すように {{ args.<name> }} として定義されます。 apiバージョン: argoproj.io/v1alpha1 AnalysisRun を作成すると、ロールアウトで定義されたパラメータが、以下に示すように AnalysisTemplate のパラメータと結合されます。 apiバージョン: argoproj.io/v1alpha1 さらに、分析パラメータは、メタデータを読み取ってそれを AnalysisTemplate にパラメータとして渡すために使用される valueFrom もサポートします。次の例では、メタデータ内の env タグと region タグを参照し、それらを AnalysisTemplate に渡します。 apiバージョン: argoproj.io/v1alpha1 ブルーグリーンプレリリース分析BlueGreen 戦略を使用したロールアウトでは、プレリリースを使用してトラフィックを新しいバージョンに切り替える前に AnalysisRun を開始できます。分析実行の成功または失敗によって、次のようにロールアウトがトラフィックを切り替えるか、ロールアウトを完全に中止するかが決まります。 種類: ロールアウト 上記の例では、新しい ReplicaSet が完全に利用可能になると、Rollout はプレリリース版の AnalysisRun を作成します。ロールアウトではトラフィックを新しいバージョンに切り替えませんが、分析の実行が正常に完了するまで待機します。 注: autoPromotionSeconds フィールドが指定されていて、Rollout が自動プロモーションが成功するまでその秒数を待機した場合、Rollout は AnalysisRun を成功としてマークし、トラフィックを新しいバージョンに自動的に切り替えます。 AnalysisRun がこれより前に完了した場合、Rollout は別の AnalysisRun を作成せず、autoPromotionSeconds の残り時間を待機します。 ブルーグリーンリリース後の分析BlueGreen 戦略を使用したロールアウトでは、トラフィックが新しいバージョンに切り替わった後のリリース後分析も使用できます。リリース後の分析が失敗またはエラーになった場合、ロールアウトは中止状態になり、トラフィックは以前の安定したレプリカセットに戻ります。リリース後の分析が成功すると、ロールアウトは完全にリリースされたと見なされ、新しいレプリカセットは安定しているとマークされ、古いレプリカセットは scaleDownDelaySeconds (デフォルトでは 30 秒) に従ってスケールダウンされます。 apiバージョン: argoproj.io/v1alpha1 故障条件failureCondition を使用すると、分析の実行が失敗するように構成できます。次の例では、Prometheus サーバーを 5 分ごとに継続的にポーリングして、エラーの合計数を取得します。 10 個以上のエラーが発生した場合、分析の実行は失敗したとみなされます。 メトリクス: 結果なしで実行分析実行 j の結果は不確定であると見なすこともできます。これは、実行が成功も失敗もしていないことを示します。結果がない実行の場合、公開は現在のステップで一時停止されます。このとき、操作を再開したり終了したりするには、人による介入が必要です。メトリックに成功または失敗の条件が定義されていない場合、分析の実行は結論が出ない例になる可能性があります。 メトリクス: 成功条件と失敗条件の両方が指定されているが、測定値がどちらの条件も満たさない場合にも、不確定な分析実行が発生する可能性があります。 メトリクス: 非決定論的な分析実行のシナリオの 1 つは、Argo Rollouts が自動的に分析実行を実行し、測定値を収集できるようにしながら、測定値が許容できるかどうかの判断を下し、続行するか中止するかを決定できるようにすることです。 遅延分析実行分析実行をすぐに開始する必要がない場合 (つまり、メトリクス プロバイダーにカナリア リリースのメトリクスを収集する時間を与えるため)、分析実行によって特定のメトリクスの分析を遅らせることができます。各メトリックは異なる遅延を持つように構成でき、特定のメトリックの遅延に加えて、バックグラウンド分析を含むリリースでは、特定のステップに到達するまで分析実行の作成を遅らせることができます。 特定の分析インジケータを遅延するには: メトリクス: バックグラウンド分析の実行開始をステップ 3 (重みを 40% に設定) まで遅延します。 apiバージョン: argoproj.io/v1alpha1 さらに、OpenKurise プロジェクトは最近、同様のプログレッシブ リリース ツールである Kruise Rollouts をリリースしました。ご興味がございましたら、https://github.com/openkruise/rollouts にアクセスして詳細をご確認ください。 |
<<: Kafka ネットワーク層ソースコード実装メカニズムにおけるメッセージの送受信プロセス全体の図解説明
>>: クラウドでのインシデント対応は、準備さえしておけば簡単です
ウェブマスターはかつて、buyvm はウェブサイト構築 + ストレージのコスト効率の高いソリューショ...
Baidu のポリシーは絶えず調整されており、ますます高品質のオリジナル コンテンツに傾倒しています...
[[407261]]以前は、TaskRun または PipelineRun オブジェクトを作成してタ...
今月中旬、Godaddyは社内従業員の操作ミスによりサーバートラブルが発生し、多数のウェブサイトに影...
Hosteons は今月 4 周年を迎え、公式 Web サイトでは OpenVZ 7 および KVM...
2012 年後半は、私たち SEO にとって激動の時期でした。Baidu が 6 月 28 日にアル...
検索エンジンのアルゴリズムが継続的に変更され、特にGreen RadishやPomegranateな...
実際の製品の使用や設計プロセスでは、製品の起動ページには常に 2 ~ 3 秒の余裕があります。では、...
概要パブリック クラウドに展開された Kubernetes クラスターでは、パブリック クラウド ベ...
パブリッククラウドストレージサービスは簡単に拡張できます。ユーザーは、ストレージ容量のニーズに応じて...
2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますウェブサイ...
ウェブサイト編集者を採用する際、どの企業も、採用した人が何も知らなかったらどうしようかと心配するでし...
ウェブサイトのランキングにおける外部リンクの役割は誰もが知っています。しかし、検索エンジンがユーザー...
現在までに、私のウェブサイトはほぼ 5 か月間オンラインになっています。SEO に関わり始めた当初は...
CentralHosts は設立されてからかなり経ちます。基本的には Lightwave に似た、個...