エンジニアリング チームは、Kubernetes 管理およびオーケストレーション レイヤーと統合されたクラウド ネイティブの可観測性プラットフォームを使用して、ビジネス目標をより早く達成できます。
クラウド ネイティブは急速にデジタル変革の好ましい方法となりましたが、複雑さとコストが増大しないわけではありません。仮想マシン (VM) ベースのインフラストラクチャとは異なり、Kubernetes を活用したクラウドネイティブ環境は常に変化しています。これらは数千のコンテナとマイクロサービスで構成され、より多くのデータを生成し、より大きな相互依存性を持ちます。 これらの課題に対処するために、エンジニアリング チームは、Kubernetes 管理およびオーケストレーション レイヤーと統合されたクラウド ネイティブの可観測性プラットフォームを使用して、デジタル ビジネス目標をより迅速に達成し、収益を保護し、イノベーションをサポートできます。 組織がクラウドネイティブの可観測性と Kubernetes 管理ソリューションの実行を検討している場合、Kubernetes の可観測性に関して従うべき 10 のベスト プラクティスを以下に示します。 次の 10 の簡単な手順に従うことで、観測データの制御、または制御の回復が可能になります。 1. 目標を明確にするまず、デジタル変革プログラムのビジョンを確立し、それを達成するための目標を設定します。たとえば、ハイブリッドな作業モードで顧客と接続できるアプリケーションの場合、サービス レベル目標 (SLO) はどうすればよいでしょうか。 逆に、目標とする平均修復時間 (MTTR) はどれくらいでしょうか。つまり、組織が許容できるダウンタイムはどれくらいでしょうか。どのようなリソースのピークを許容し、どれだけの資金を投資できるかを最初から決定する必要があります。これから逆算して、目標を達成するために必要な平均検出時間 (MTTD) を決定できます。 2. 最適な可観測性ソリューションを選択するすべてのデジタル変革プロジェクトと同様に、チームはユースケースと目標に応じて、可能な限り最善のソリューションまたはソリューションの組み合わせを探す必要があります。 Kubernetes の監視やクラウド ネイティブ化には、万能のアプローチはありません。それは、人材、組織、ビジネス目標、既存のテクノロジー スタックによって異なります。 組織に最適な可観測性ソリューションを選択する際に考慮すべきツールの種類は次のとおりです。
必要なソリューションを特定したら、それをどのように活用するかを決定します。オープンソースは、Kubernetes に依存するクラウド ネイティブ エコシステム コレクターにとって重要な機能です。 可観測性を展開してアクセスするための主な方法は次のとおりです。
ソリューションを選択する最後のステップは、クラウド プロバイダー ツールを選択することです。単一のクラウド環境の場合、既存のクラウド インフラストラクチャとの緊密な統合により価格上の利点と可視性が得られるため、クラウド プロバイダーの分析および監視ツールを使用するのが合理的です。単一のクラウドを使用する場合でも、複数のクラウドを使用する場合でも、顧客エクスペリエンスに対する責任はあなたにあります。 3. コードインストルメンテーション使用するツールを最大限に活用し、分散トレースを実装するには (ポイント 7 を参照)、コードをインストルメント化する必要があります。実際には、コードをインストルメント化するということは、データを収集し、それを任意の場所に送信することを意味します。アプリケーション パフォーマンス モニタリング (APM) またはインフラストラクチャ モニタリング プロバイダーを使用する場合のようなベンダー ロックインはありません。多くのソリューションは、特別な作業をしなくてもすぐに使用できますが、コードをインストルメント化することで、利用可能な最良のデータを取得して、最善の行動を取ることができます。 オープンソースの世界では、Prometheus は Kubernetes クラスターの健全性を把握するための標準です。ただし、実際には出力されるすべてのデータが必要になるわけではないので、注意して進めてください。データがあなたや組織にとって役に立たない場合、それは負担になります。特定のユースケースやビジネス ニーズに合わせて調整された監視エクスペリエンスは、常に、万能のアプローチよりも優れています。 Prometheus ダッシュボードを使用して学習する場合は、この点に注意してください。 4. ダッシュボードを使用して観測データを収集し、視覚化するエンジニアは、データの視覚化を実現するダッシュボードの作成を担当します。こうすることで、システム内で何が起こっているかをすぐに理解できます。多くのソリューションにはダッシュボード システムが含まれています。たとえば、Chronosphere は、Query Accelerator テクノロジーを通じて、より高速なダッシュボードを実現するのに役立ちます。システム全体で、手動での最適化を必要とせずに、迅速かつ効率的に実行されます。 このアプローチは、エンジニアが PromQL などのクエリ言語、環境のアーキテクチャとスケール、可観測性ソリューションの基盤となるデータ モデル、またはテスト対象のクエリが本番環境でどのように実行されるかについて深い専門知識を持つ必要がないため、よりシンプルです。 5. リソースの使用状況を追跡するリソース使用率の大幅な変化は、顧客ベースの急増や停止など、良いニュースにも悪いニュースにもなり得ます。どちらの場合でも、既存の APM またはインフラストラクチャ監視ツールを使用して、使用されているリソースの量、使用されているリソースの種類、使用されているアプリケーション、リソースが過剰に使用されているかどうかを把握することは困難です。 Chronosphere の観測データ最適化サイクルは、分析、改良、および実行のプロセスを通じて観測データのコストをより深く理解し、制御するためのアクションを実行することで、組織がこれらの課題を克服するのに役立ちます。 6. ログ記録とログの集約クラウド ネイティブの世界では、ログ記録はチームがシステム イベントをキャプチャ、集約、理解するのに役立つため重要です。クラウドネイティブ アーキテクチャでは、イベントの数が増えますが、独立したシステム内の無関係なログの数も増えます。これにより、必要なデータを見つけて問題をトラブルシューティングすることが難しくなります。メトリックは問題の症状を診断するための重要なツールですが、問題を特定するにはトレースを使用する必要があります。また、ログは問題の根本原因を発見するのに最適です。 Kubernetes 環境でログを制御するには、データを集約してフィルタリングし、無駄を減らしてコストを節約し、必要なデータをタイムリーに簡単に見つけられるようにする必要があります。 7. 分散トレースコードを適切にインストルメント化しないと (ポイント 2 を参照)、分散トレースをサポートすることはできません。ただし、分散トレースを使用すると、システム全体でリクエストがどのように実行されるかを確認できます。これにより、実行に時間がかかりすぎる単一の機能を特定し、顧客エクスペリエンスに影響を与える前にその理由を詳しく理解することができます。 8. アラートと通知手順 1 ~ 7 を完了したら、自分自身またはチームへのアラートと通知を設定することをお勧めします。こうすることで、問題が発生した場合でも、タイムリーに整理して修正することができます。 9. ベストプラクティスとアップデートに従うこのステップは常識です。ほぼ毎日新しいアップデートが登場するため、将来に備えるのは簡単ではありません。ソリューション パッチと観測可能性のベスト プラクティスを最新の状態に保ちます。可能な場合は自動化を追加して、時間がかかり、エラーが発生しやすい手動プロセスを排除します。 10. コストを管理する最高の可観測性プラットフォームは、クラウド コストと可観測性支出の管理に役立ちます。 Chronosphere とそのコントロール プレーンなどのソリューションを選択すると、可観測性ファネルに沿ったさまざまなツールが提供され、組織は次のことが可能になります。
この透明性により、貴重で才能のあるエンジニアは、ビジネスにさらに大きな影響を与えるプロジェクトに集中できるようになります。コスト管理を実施したら、データの有用性を把握するためにデータを微調整し始めることができます。可観測性の支出に基づいてチームの割り当てを設定し、独立したマイクロサービスを実行しているチーム全体でコストの傾向分析を実行します。 クラウドネイティブ入門クラウド ネイティブ環境は、デジタル変革の力を活用したいと考えている企業にとって不可欠ですが、連携してベスト プラクティスを採用できる適切なツールを備えている必要があります。 Chronosphere とそのパートナーは、クラウド ネイティブ環境の複雑さを抽象化し、データを最適化し、エンジニアの作業負荷を軽減するためにゼロから構築されました。 |
<<: サービス検出は、動的な運用と保守において、サービス アドレスの適時性を継続的に維持するにはどうすればよいでしょうか。
>>: クラウド コンピューティングが企業の持続的な成長を支援する 5 つの方法
ニュースソース: 「コンピュータニュース」2012年第21号 (2012年5月28日発行) News...
6月9日、アリババクラウドは2020年アリババクラウドオンラインサミットにおいて、スマートハイウェイ...
A5のウェブサイトでは毎日多くの著者がウェブサイト構築の経験を共有していますが、彼らの言葉には自信と...
7月30日午後、共同購入業界は昨年末から沈黙の時期に入った。「2012年上半期共同購入統計報告」によ...
他の業界のウェブサイトと比較すると、ローカル ウェブサイトのプロモーションには、主にユーザー グルー...
spartanhost には特別な VPS があり、KVM 仮想化、1000M ポート、ダラス デー...
エンタープライズ クラウド向けソフトウェア インテリジェンス企業である Dynatrace は本日、...
自分のウェブサイトが含まれていない場合はどうすればいいですか? 重みが足りない場合は、フレンドリーリ...
トルコの VPS とトルコのサーバーが必要な皆さん、今日はトルコのサーバー業者 citynethos...
【51CTO.comオリジナル記事】年末から年明けにかけて、誰もが何らかの総括や予測を立て、2021...
[[431325]] JVM 全体構造HotSpot VM は、市場における代表的な高性能仮想マシン...
普段はアクセス数が多くPVも高いWebサイトなのに、ある日突然PVが下がり始めたら、Webサイトのコ...
6月22日以降、インターネット全体の個人ウェブサイトで異常な動作が発生し始めました。まず、Baidu...
インターネットの急速な発展に伴い、ますます多くの人々がインターネット業界に参入しています。同時に、誠...
1. 需要分析ご存知のとおり、これはデザインの最初のステップであり、イベント全体のスタイルがこのステ...