Kubernetes のバックアップと復元でよくある 7 つの間違い

Kubernetes のバックアップと復元でよくある 7 つの間違い

翻訳者 |張哲剛

校正 |孫淑娟 梁策

企業が Kubernetes を本番環境に導入し、Kubernetes クラスターとアプリケーションの数が増え続けるにつれて、他の本番システムに匹敵する「エンタープライズ レベル」のサービスも提供する必要が生じます。 Kubernetes バックアップを実行することは、事故、システム クラッシュ、または悪意のある攻撃が発生した場合にアプリケーションの操作を保護するために重要です。アプリケーション自体の復元力とデータ保護メカニズムに加えて、正確で効果的なバックアップ戦略を導入する必要があります。

適切な Kubernetes バックアップおよびリカバリ戦略は、次の要件を満たす必要があります。

  • 不可抗力の事故が発生した場合でも、クラスター全体を復元できます(災害復旧)。
  • 特定のアプリケーションを回復する(例:一部のデータが破損している場合)
  • 異なる環境間でクラスターを移行します (オンプレミスからクラウドへ、またはその逆)。

Kubernetes バックアップの難しさは、エラーが発生しやすいことです。このため、技術者はバックアップを操作する際に慎重になる必要があります。そうしないと、クラスターまたはアプリケーションをクラッシュから正常な状態に復元することが困難 (または不可能) になります。この記事では、Kubernetes バックアップのリスク要因と Kubernetes バックアップの使用に関するベスト プラクティスを探るために、Kubernetes のバックアップとリカバリの一般的なエラー 7 つを分析します。

Kubernetes バックアップの違いは何ですか?

Kubernetes 上のアプリケーションのバックアップは、仮想マシン上のアプリケーションのバックアップと復元とは大きく異なります。 Kubernetes 環境は非常に動的であり、単一の運用アプリケーションは、コンテナまたはポッド、構成ファイル ストレージ、証明書、暗号化資格情報、ボリュームなど、数百のコンポーネントで構成される場合があります。コンテナ インスタンスは負荷やその他の運用要件に基づいて変更されるため、データは動的に作成できる単一または複数の永続ボリュームに書き込まれ、保存されます。正常に復元するには、Kubernetes アプリケーションのバックアップでこの情報をすべてキャプチャする必要があります。完全な Kubernetes クラスターのバックアップには、/etcd に保存されているすべての Kubernetes コントロール プレーン パラメーター、すべての名前空間、およびすべての永続ボリュームが含まれている必要があります。

Kubernetes のバックアップと復元の落とし穴

オペレーターや開発者がミスを犯す可能性があり、最も堅牢なハードウェアやソフトウェアであっても障害が発生する可能性があります。サイバー犯罪がますます蔓延する今日、正確で完全かつタイムリーなバックアップは、人間の不正行為に対する最後の防衛線です。 Kubernetes のバックアップとリカバリは、本番運用の正常な動作にとって非常に重要であるため、次の 7 つの一般的な間違いを回避するように最善を尽くす必要があります。

間違い1: バックアップを管理するスクリプトを手動で作成する

アプリケーション環境とビジネス要件が非常に限られている場合は、Kubernetes API を使用して、アプリケーションに関連付けられたポッド、サービス、構成ファイル ストレージ、データ ストレージ、暗号化資格情報をバックアップまたはスナップショットするスクリプトを簡単に作成できます。このアプローチの欠点は、まったく拡張できないことです。導入されるクラスターとアプリケーションの数が増えると、このアプローチは完全に機能しなくなります。さらに、完全に手動スクリプトに依存する環境では、すべての操作が非常に脆弱になり、追跡が困難になります。最終的には、各クラスターが独自のバリアントを開発し、経験豊富な専門家だけが解決できるレベルまで問題が拡大します。

間違い2: バックアッププロセスを自動化しない

Kubernetes デプロイメントの目標は、可能な限り操作を自動化することです。大規模なビジネス運営には自動化が不可欠です。厳密に言えば、クラスターやアプリケーションのバックアップなど、定期的に実行する必要があるタスクはすべて自動化する必要があります。さらに、Kubernetes 環境は頻繁に変更されるため、技術者はスケジュールされたバックアップに加えて、一時的なバックアップをタイムリーに操作できる必要があります。

間違い3: バックアップを管理するために複数の管理ツールを使用する

Kubernetes 環境は時間の経過とともに進化するため、バックアップを管理するために複数のツールを使用するのが一般的です。

  • 技術者は、さまざまな Kubernetes ディストリビューションにさまざまなツールを適用します。または、ローカル クラスターとパブリック クラウドでのバックアップに異なるツールを使用します。
  • 技術者は、/etcd (コントロール パネル) をバックアップするために既存のツールまたはスクリプトを使用しますが、永続ボリュームをバックアップするためには他のツールまたはストレージ方法を使用します。

問題がなければ、すべて順調であるように見えます。しかし、複数の管理ツールを使用すると、遅かれ早かれ Kubernetes のリカバリに問題が発生します。特定の時点に復元するために、2 つ以上の管理ツールをどのように調整しますか?同じアプリケーションを複数の異なるクラスターで復元する必要がある場合はどうすればよいでしょうか?したがって、正しい選択は、シンプルで明確な(少なくとも可能な限りシンプルで明確な)ツールを使用して管理することです。そうすれば、いつでもどこでも操作と回復が同じになり、使い慣れたものになります。

間違い4: 永続ボリュームを適切にバックアップしていない

名前が示すように、永続ボリュームは永続的であることを目的としています。永続ボリュームを本当に永続的にしたい場合は、バックアップが必須です。 Kubernetes 環境は動的であるため、クラスターとアプリケーションの変更に合わせてバックアップも進化させる必要があります。バックアップが現在のオペレーターの視野内にある永続ボリュームに限定されている場合、遅かれ早かれバックアップ操作に漏れが生じ、すべてのコンテンツが正しくバックアップされないことになります。個人用か商用かにかかわらず、Kubernetes バックアップのデプロイメントでは、クラスターの状態をチェックして、バックアップする必要がある永続ボリュームを判別できる必要があります。ポリシーベースのアプローチにより、技術者は、提供する必要のあるサービス レベルに基づいて、永続ボリュームを適切かつ必要な期間にバックアップできるようになります。

間違い5: バックアップの実行を監視する機能がない

システム管理者にとって最悪なのは、緊急復元を開始したところ、過去 2 週間のバックアップが失敗していたことが判明することです。使用するバックアップ ツールに関係なく、バックアップの実行を完全に監視し、バックアップが成功したかどうかを確認する機能が厳密に必要です。あらゆる種類のランサムウェア攻撃で使用される一般的な戦術は、バックアップ機能を静かに無効にすることであるため、これは特に重要です。回復が不可能になった場合、唯一の選択肢はウォレットを開くことです。

間違い6: バックアップ認証情報を安全に保存していない

Kubernetes 環境が複数のクラスターに拡張されると、クラスターごとに個別のバックアップ認証情報が必要になります。これらの資格情報は、重大な脆弱性となる可能性があります。したがって、不正アクセスを防ぐためにそれらを管理し、保護することが、バックアップ資格情報を保存する際の基本的な事項です。理想的には、バックアップやその他の資格情報を自動的に処理する Kubernetes バックアップ デプロイメントが必要になります。

最近のブログ投稿「Kubernetes のセキュリティ保護: Kubernetes 環境へのゼロ トラスト原則の適用」では、Kubernetes クラスターへの不正アクセスを防ぐために組み込みの Kubernetes 機能を適用する方法について説明しています。

間違い7: コンプライアンスを適切に管理していない

どの業界にも満たさなければならないコンプライアンス要件があります。ほとんどの組織には独自の業界行動規範もあります。これらの規制の要件を理解して、要件を満たしているか、または許容誤差があるかを確認し、監査人やセキュリティ当局に対してコンプライアンスを実証できることを確認することが重要です。

定期的なレポートにより、問題を確認して特定し、Kubernetes バックアップ プランが実装されていない場所を見つけ、データの損失や漏洩のリスクを軽減し、ビジネスの評判に影響を与える頻繁なダウンタイムを回避できます。

翻訳者について

Zhang Zhegang 氏は、51CTO コミュニティ エディター、システム運用および保守エンジニア、中国で最も初期のハードウェア レビュー担当者およびインターネット実践者の 1 人であり、Alibaba の元従業員です。 ITプロジェクト管理における10年以上の経験と総合的な知識とスキルを持ち、複数のウェブサイトアーキテクチャの設計や電子政府システムの開発に携わり、市町村レベルの入学試験管理プラットフォームの運用保守を主導してきました。

原題: Kubernetes のバックアップとリカバリでよくある 7 つの間違い、著者: Kyle Hunter

<<:  中国モバイルクラウドの最新財務報告が発表:「200億」時代に向けて加速中!

>>:  CentOS のシャットダウンから見る Red Hat の Linux に対する考え

推薦する

第1四半期の自営生鮮食品eコマースのユーザーに関する洞察

第1四半期では、生鮮食品の電子商取引ユーザーの活動は大きく変動しました。春節期間中、都市部のユーザー...

トラフィックコンバージョンを促進する方法

ウェブサイトのコンバージョンは、SEOの最終目標です。ウェブサイトのコンバージョン率がなければ、トラ...

ブランドマーケティングの90%は常識さえない

01マーケティングで何が変わり、何が変わらないのかモバイルインターネットの爆発的な普及後、マーケティ...

静的ページと動的ページ、検索エンジンはどちらを優先するのでしょうか?

ウェブサイトの最適化に関して言えば、静的ページと動的ページのどちらが優れているかは、多くの最適化担当...

ガートナー:世界のパブリッククラウド支出は2021年に3,323億ドルに達する

海外メディアは、市場調査会社ガートナーが発表した最新のレポートによると、世界のパブリッククラウド支出...

ソース分析からウェブサイトのプロモーション効果を判断する方法についての簡単な説明

ソース分析は統計ツールの機能の 1 つに過ぎないことは皆さんご存知だと思いますが、この小さな機能によ...

SEO 外部リンク 高度な戦略リソース ステーション グループ

インデックスが大きく、競争が激しいキーワードの中には、サポートするために多くの外部リンクを必要とする...

平和なウェブマスターはウェブマスターネットワークの重みの変化とスナップショットの異常を分析します

いつの間にか、ウェブサイトは2年間運営されてきました。この2年間、私はさまざまな浮き沈みを経験しまし...

工業情報化省のAPP申請要件は、実施の難しさに関する懸念を引き起こしている。

12月11日、工業情報化部がAPP登録を実施する予定であるというニュースがモバイルインターネット業界...

電子商取引大手の交通不安

新しい領域を指し示します。最近、主要な電子商取引プラットフォームは、トラフィックプールの活用と拡大を...

Hawkhost - 全品 60% オフ/本日限定/Web ホスティング/リセラー/VPS/サーバー

Hawkhost のウェブサイトがリニューアルされました。以前の古いスタイルよりもずっと良くなったと...

あそこの景色は美しいですね。国内のショッピングガイドサイトがどこへ向かうのか見てみましょう

つい最近、Pinterest が新たに 2 億ドルを調達しました。昨日の午後、Fanli.com は...

中小規模の動画サイトの怪しい世界は未だに存在し、上流企業が密かに支援している

ITタイムズ記者 王欣QVODテクノロジーの付加価値通信事業ライセンスが5月15日に取り消されて以来...