必要 日々の仕事では、すべてのプロジェクトが完璧というわけではありません。ポッドのステータスは実行中であるが、プログラムが応答しないという状況によく遭遇します。これが起こる理由はたくさんあります。これは、ps を使用してプロセスをチェックするなど、k8s ヘルス チェックが原因である可能性があります。または、プログラムが無限ループに陥っていても終了しない可能性があります。または、ネットワークが切断され、プログラムが再接続できないなどの可能性があります。 理由が何であれ、解決策はありますが、最適化には時間がかかります。完全に解決する前に、問題を解決する必要があります。そこで一時的な解決策を考えました。私の会社のプロジェクト ログが stdout に直接印刷されるため、プログラムが応答しなくなります。より簡単な方法は、ログ出力の時間を決定することです。これに基づいて、ログが長時間出力されないことがわかったときにポッドを再起動するための小さなスクリプトを簡単に作成できます。 アイデア kubectl logs コマンドを実行して、最後のログ出力のタイムスタンプを確認し、それをサーバーの時間と比較します。差がしきい値より大きい場合は、対応する POD を再起動します。もちろん、これは単なる単純なアイデアであり、ほとんどのシナリオには適用できませんが、コアプロジェクトには多数のリクエストがあるため、私の会社には適しています。ログが 1 分以上更新されない場合、基本的に 100% 問題があると判断できます。 このアイデアは単なる出発点に過ぎませんが、皆さんにインスピレーションを与えることができれば幸いです。もっと良い方法があれば、著者とコミュニケーションをとることもできます。 シンプルな実装 シェルは比較的シンプルで、サーバーと直接やり取りするのもより簡単なので、シェルを使用して記述するだけです。
スクリプトは非常にシンプルです。まずポッドをクエリし、次にポッドの最後のログの時間を調べて、それをサーバーの時間と比較します。遅延が 30 秒を超えると、ポッドが再起動され、エンタープライズ WeChat インターフェースが呼び出されて通知が送信されます。 追記 この方法は一時的な解決策に過ぎず、根本的な原因を解決するものではありません。症状に対処するには、問題を根本から解決する必要がありますが、これには時間がかかります。問題が解決する前に、まずこの小さなスクリプトを使用して問題に対処してください。皆さんの批判も歓迎します。 |
<<: テンセントミーティングが中国で初めてSOC2タイプ2監査に合格したビデオ会議製品に
>>: 大きなエネルギーが待ち受けている:中国電子クラウドがクラウドコンピューティング市場に参入、警笛が鳴る
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスWeiboマーケティング...
モバイル業界にとって、2019 年は終わりに近づいており、来年はさらに幅広い発展の見通しが期待されて...
ビデオ編集アプリが一定の段階まで発展すると、ビジネスモデルの開発という同じ問題に直面することになりま...
1. Xiaomi 360の「衝突」:ネットユーザーがXiaomi 3とXiaomi 3の戦いを観察...
アリババとテンセントの戦争は、CエンドからBエンドへ、そしてBエンドからクラウドへと広がっています。...
10月31日、Xunleiの新世代シェアリングエコノミースマートハードウェア「One Cloud」の...
日本のクラウドサーバーで一番良いのはどれですか?どの日本のクラウドサーバーが速いですか?日本のクラウ...
ゲスト クラスターは、すべてのクラスター ポイントが仮想マシンであるフェールオーバー クラスターです...
まず、ユーザーが商品を返品または交換したい理由を考えてみましょう。明らかに、悪意のあるレビュー投稿者...
drserver.net のストレージ VPS ブランドである XenS の「言葉にできない」時代は...
2002 年当時、Apple の iMac G4 は市場で最も軽量、最薄、そして最も洗練されたコンピ...
インターネット上の競争は白熱した段階に達しており、このような特別な時期には、市場で最も人気があるWe...
私は a5 ウェブマスターの Web サイトに記事を送信しましたが、多くのウェブマスターが記事を収集...
クラウド コンピューティングは長い間話題になっているため、多くのビジネス オーナーはそれが唯一のもの...
消費者心理にはさまざまな種類があり、インターネット上の多くの記事でも関連する説明が提供されていますが...