Kubernetes のバックアップと復元でよくある 7 つの間違い

Kubernetes のバックアップと復元でよくある 7 つの間違い

翻訳者 |張哲剛

校正 |孫淑娟 梁策

企業が Kubernetes を本番環境に導入し、Kubernetes クラスターとアプリケーションの数が増え続けるにつれて、他の本番システムに匹敵する「エンタープライズ レベル」のサービスも提供する必要が生じます。 Kubernetes バックアップを実行することは、事故、システム クラッシュ、または悪意のある攻撃が発生した場合にアプリケーションの操作を保護するために重要です。アプリケーション自体の復元力とデータ保護メカニズムに加えて、正確で効果的なバックアップ戦略を導入する必要があります。

適切な Kubernetes バックアップおよびリカバリ戦略は、次の要件を満たす必要があります。

  • 不可抗力の事故が発生した場合でも、クラスター全体を復元できます(災害復旧)。
  • 特定のアプリケーションを回復する(例:一部のデータが破損している場合)
  • 異なる環境間でクラスターを移行します (オンプレミスからクラウドへ、またはその逆)。

Kubernetes バックアップの難しさは、エラーが発生しやすいことです。このため、技術者はバックアップを操作する際に慎重になる必要があります。そうしないと、クラスターまたはアプリケーションをクラッシュから正常な状態に復元することが困難 (または不可能) になります。この記事では、Kubernetes バックアップのリスク要因と Kubernetes バックアップの使用に関するベスト プラクティスを探るために、Kubernetes のバックアップとリカバリの一般的なエラー 7 つを分析します。

Kubernetes バックアップの違いは何ですか?

Kubernetes 上のアプリケーションのバックアップは、仮想マシン上のアプリケーションのバックアップと復元とは大きく異なります。 Kubernetes 環境は非常に動的であり、単一の運用アプリケーションは、コンテナまたはポッド、構成ファイル ストレージ、証明書、暗号化資格情報、ボリュームなど、数百のコンポーネントで構成される場合があります。コンテナ インスタンスは負荷やその他の運用要件に基づいて変更されるため、データは動的に作成できる単一または複数の永続ボリュームに書き込まれ、保存されます。正常に復元するには、Kubernetes アプリケーションのバックアップでこの情報をすべてキャプチャする必要があります。完全な Kubernetes クラスターのバックアップには、/etcd に保存されているすべての Kubernetes コントロール プレーン パラメーター、すべての名前空間、およびすべての永続ボリュームが含まれている必要があります。

Kubernetes のバックアップと復元の落とし穴

オペレーターや開発者がミスを犯す可能性があり、最も堅牢なハードウェアやソフトウェアであっても障害が発生する可能性があります。サイバー犯罪がますます蔓延する今日、正確で完全かつタイムリーなバックアップは、人間の不正行為に対する最後の防衛線です。 Kubernetes のバックアップとリカバリは、本番運用の正常な動作にとって非常に重要であるため、次の 7 つの一般的な間違いを回避するように最善を尽くす必要があります。

間違い1: バックアップを管理するスクリプトを手動で作成する

アプリケーション環境とビジネス要件が非常に限られている場合は、Kubernetes API を使用して、アプリケーションに関連付けられたポッド、サービス、構成ファイル ストレージ、データ ストレージ、暗号化資格情報をバックアップまたはスナップショットするスクリプトを簡単に作成できます。このアプローチの欠点は、まったく拡張できないことです。導入されるクラスターとアプリケーションの数が増えると、このアプローチは完全に機能しなくなります。さらに、完全に手動スクリプトに依存する環境では、すべての操作が非常に脆弱になり、追跡が困難になります。最終的には、各クラスターが独自のバリアントを開発し、経験豊富な専門家だけが解決できるレベルまで問題が拡大します。

間違い2: バックアッププロセスを自動化しない

Kubernetes デプロイメントの目標は、可能な限り操作を自動化することです。大規模なビジネス運営には自動化が不可欠です。厳密に言えば、クラスターやアプリケーションのバックアップなど、定期的に実行する必要があるタスクはすべて自動化する必要があります。さらに、Kubernetes 環境は頻繁に変更されるため、技術者はスケジュールされたバックアップに加えて、一時的なバックアップをタイムリーに操作できる必要があります。

間違い3: バックアップを管理するために複数の管理ツールを使用する

Kubernetes 環境は時間の経過とともに進化するため、バックアップを管理するために複数のツールを使用するのが一般的です。

  • 技術者は、さまざまな Kubernetes ディストリビューションにさまざまなツールを適用します。または、ローカル クラスターとパブリック クラウドでのバックアップに異なるツールを使用します。
  • 技術者は、/etcd (コントロール パネル) をバックアップするために既存のツールまたはスクリプトを使用しますが、永続ボリュームをバックアップするためには他のツールまたはストレージ方法を使用します。

問題がなければ、すべて順調であるように見えます。しかし、複数の管理ツールを使用すると、遅かれ早かれ Kubernetes のリカバリに問題が発生します。特定の時点に復元するために、2 つ以上の管理ツールをどのように調整しますか?同じアプリケーションを複数の異なるクラスターで復元する必要がある場合はどうすればよいでしょうか?したがって、正しい選択は、シンプルで明確な(少なくとも可能な限りシンプルで明確な)ツールを使用して管理することです。そうすれば、いつでもどこでも操作と回復が同じになり、使い慣れたものになります。

間違い4: 永続ボリュームを適切にバックアップしていない

名前が示すように、永続ボリュームは永続的であることを目的としています。永続ボリュームを本当に永続的にしたい場合は、バックアップが必須です。 Kubernetes 環境は動的であるため、クラスターとアプリケーションの変更に合わせてバックアップも進化させる必要があります。バックアップが現在のオペレーターの視野内にある永続ボリュームに限定されている場合、遅かれ早かれバックアップ操作に漏れが生じ、すべてのコンテンツが正しくバックアップされないことになります。個人用か商用かにかかわらず、Kubernetes バックアップのデプロイメントでは、クラスターの状態をチェックして、バックアップする必要がある永続ボリュームを判別できる必要があります。ポリシーベースのアプローチにより、技術者は、提供する必要のあるサービス レベルに基づいて、永続ボリュームを適切かつ必要な期間にバックアップできるようになります。

間違い5: バックアップの実行を監視する機能がない

システム管理者にとって最悪なのは、緊急復元を開始したところ、過去 2 週間のバックアップが失敗していたことが判明することです。使用するバックアップ ツールに関係なく、バックアップの実行を完全に監視し、バックアップが成功したかどうかを確認する機能が厳密に必要です。あらゆる種類のランサムウェア攻撃で使用される一般的な戦術は、バックアップ機能を静かに無効にすることであるため、これは特に重要です。回復が不可能になった場合、唯一の選択肢はウォレットを開くことです。

間違い6: バックアップ認証情報を安全に保存していない

Kubernetes 環境が複数のクラスターに拡張されると、クラスターごとに個別のバックアップ認証情報が必要になります。これらの資格情報は、重大な脆弱性となる可能性があります。したがって、不正アクセスを防ぐためにそれらを管理し、保護することが、バックアップ資格情報を保存する際の基本的な事項です。理想的には、バックアップやその他の資格情報を自動的に処理する Kubernetes バックアップ デプロイメントが必要になります。

最近のブログ投稿「Kubernetes のセキュリティ保護: Kubernetes 環境へのゼロ トラスト原則の適用」では、Kubernetes クラスターへの不正アクセスを防ぐために組み込みの Kubernetes 機能を適用する方法について説明しています。

間違い7: コンプライアンスを適切に管理していない

どの業界にも満たさなければならないコンプライアンス要件があります。ほとんどの組織には独自の業界行動規範もあります。これらの規制の要件を理解して、要件を満たしているか、または許容誤差があるかを確認し、監査人やセキュリティ当局に対してコンプライアンスを実証できることを確認することが重要です。

定期的なレポートにより、問題を確認して特定し、Kubernetes バックアップ プランが実装されていない場所を見つけ、データの損失や漏洩のリスクを軽減し、ビジネスの評判に影響を与える頻繁なダウンタイムを回避できます。

翻訳者について

Zhang Zhegang 氏は、51CTO コミュニティ エディター、システム運用および保守エンジニア、中国で最も初期のハードウェア レビュー担当者およびインターネット実践者の 1 人であり、Alibaba の元従業員です。 ITプロジェクト管理における10年以上の経験と総合的な知識とスキルを持ち、複数のウェブサイトアーキテクチャの設計や電子政府システムの開発に携わり、市町村レベルの入学試験管理プラットフォームの運用保守を主導してきました。

原題: Kubernetes のバックアップとリカバリでよくある 7 つの間違い、著者: Kyle Hunter

<<:  中国モバイルクラウドの最新財務報告が発表:「200億」時代に向けて加速中!

>>:  CentOS のシャットダウンから見る Red Hat の Linux に対する考え

推薦する

東南アジアへのグローバル展開:フィリピンにおけるインフルエンサーマーケティングの現状と今後の展開

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますフィリピン...

reprisehosting: シアトルでAlipayに公式接続された超格安サーバーを提供

格安サーバーを販売するアメリカの会社reprisehostingが、正式にAlipay決済を導入した...

Baidu はオリジナルコンテンツについてどう考えていますか?

「Baiduオリジナルコンテンツ」は、ウェブマスターの間で常に話題になっています。Baiduのアルゴ...

保険業界向けのクラウドコンピューティング関連の標準が4つ公開されました

中国保険業界協会は1月13日、北京で「保険業界向けコンテナベースクラウドコンピューティングプラットフ...

spinserver: 開始まで 15 分/米国の超ハイエンド サーバー、月額 89 ドルから、10G 帯域幅、40 コア/80 スレッド/768G メモリ/8T SSD

spinserver は、米国西海岸のサンノゼと中央データセンターであるダラスで独立サーバー事業に注...

チャネル操作とは何ですか?

チャネル、私たちは皆、チャネルの同義語が太ももであることを知っています。すべての CP の目には、チ...

SAP、Humi.com、重慶ハイテクゾーンが共同で「重慶中小企業インテリジェントエンパワーメントセンター」を建設

最近、SAPはHumi.comおよび重慶ハイテクゾーンと三者戦略提携を結び、「重慶中小企業インテリジ...

[高同時実行性] 数十億のトラフィック下で分散電流制限を実現するにはどうすればよいでしょうか?これらの理論をマスターしなければなりません! !

[[335435]]著者は、正確にスケジュールされたタスクと遅延キュー処理機能を備えた、高同時実行シ...

friendhosting: 新年のフラッシュセール、全10データセンターのVPSが50%オフ、最低$16/年、トラフィック無制限

friendhosting は新年の VPS フラッシュセールを開始しました。すべての VPS には...

教育ポータルは、ユーザーの検索エクスペリエンスを向上させるために、目を引く検索ボックスを備えて再設計されました。

みなさんこんにちは、@张钾杰です。最近、多くの伝統的な教育情報ポータルが次々と改訂されていることがわ...

Kafka はどのようにして 1 秒間に 1,500 万件のメッセージを処理するのでしょうか?

[[245749]] [51CTO.com からのオリジナル記事] Apache Kafka は、N...

B2B業界のウェブサイトにおける「ページ要素間の距離」の標準についての簡単な説明

この章では、主に B2B 業界の Web サイトの Web ページのさまざまな要素間の距離について説...

チャンネル運営の観点からどのように運営していくかお話しします

午後になって眠くなったので、階下のオフィスに行ってタバコを吸いたいと思いました。 1階に歩いていくと...