ビジネスの中断を回避する、K8s ノードのトラブルシューティング ガイド、ぜひご覧ください。

ビジネスの中断を回避する、K8s ノードのトラブルシューティング ガイド、ぜひご覧ください。

Kubernetes は強力なコンテナ オーケストレーション システムですが、動作中にノード障害が発生する可能性があります。このチュートリアルでは、クラスターの信頼性と安定性を確保するために、K8S ノード障害の一般的な問題を深く理解してトラブルシューティングする方法を説明します。

ステップ1: ノードのステータスを確認する

まず、次のコマンドでノードの全体的なステータスを確認します。

 kubectl get nodes

上記のコマンドを実行すると、入力結果は次のようになります。

すべてのノードが準備完了状態であることを確認します。ノードが NotReady 状態の場合、次のコマンドを実行して詳細情報を表示できます。

 kubectl describe node <node-name>

たとえば、次のように node01 ノードの詳細を表示します。

ステップ2: イベントを表示する

次のコマンドを使用して、クラスター内のイベントに異常がないか確認します。

 kubectl get events

上記のコマンドを実行すると、入力結果は次のようになります。

ステップ3: システムリソースのチェック

ノード上のシステム リソース (CPU、メモリ、ディスク領域) が十分であることを確認します。これは次のコマンドで確認できます。

 kubectl describe node <node-name> | grep Allocated -A 5

上記のコマンドを実行すると、入力結果は次のようになります。

ステップ4: ネットワークのトラブルシューティング

(1)ネットワークプラグインの状態を確認する

ネットワーク プラグインが正しく機能していることを確認します。一般的なネットワーク プラグインには、Flannel、Calico などがあります。次のコマンドを使用して確認します。

 kubectl get pods -n kube-system

上記のコマンドを実行すると、入力結果は次のようになります。

(2)ノード間のネットワーク接続を確認する

ノード間のネットワーク通信が正常かどうかを確認します。 ping や traceroute などのツールを使用して、ノード間の接続を確認します。たとえば、次の図は、node01 からコントロール プレーンへの ping を示しています。

ステップ5: コンテナのランタイムステータスを確認する

コンテナ ランタイムとして Docker を使用している場合は、Docker コンテナのステータスを確認します。

 docker ps docker logs <container-id>

コンテナ ランタイムとして containerd が使用されている場合は、以下に示すように、containerd コンテナのステータスを確認してください。

ステップ6: kubeletサービスのステータスを確認する

ノード上で kubelet サービスが適切に実行されていることを確認します。次のコマンドを実行します。

 systemctl status kubelet

出力をチェックして、kubelet サービスがアクティブであることを確認します。 kubelet サービスがアクティブ化されていない場合は、次のコマンドを実行して kubelet サービスを再起動します。

 sudo systemctl restart kubelet

ステップ7: 障害が発生したノードを再起動する

運用負荷に影響が及ばないようにしながら、障害が発生したノードの再起動を試みることができます。次のコマンドを使用します。

 kubectl drain <node-name> --ignore-daemonsets kubectl delete node <node-name>

結論は

上記の手順に従うことで、Kubernetes ノードの障害に関する一般的な問題を診断して解決できるようになります。操作を実行する前に、操作の潜在的なリスクを理解し、非本番環境でテストするようにしてください。 K8S クラスターを定期的に監視し、K8S が提供するツールを学習して使いこなすことで、コンテナ化されたアプリケーションの管理と保守が向上します。

9CKAの本当の質問

(1)実際のテスト問題のスクリーンショット:

(2)中国の分析

k8s クラスター環境を切り替えます: kubectl config use-context wk8sTask: wk8s-node-0 という名前のノードは NotReady 状態です。その他を通常の状態に復元し、起動時にすべての変更が自動的に完了することを確認します。

  • 次のコマンドを使用して、ssh経由でwk8s-node-0ノードに接続できます: ssh wk8s-node-0
  • ノードに対するより高い権限を取得するには、次のコマンドを使用します: sudo -i

(3)公式参考資料

ノードを安全にドレインする: https://kubernetes.io/en-us/docs/tasks/administer-cluster/safely-drain-node/

(4)質問に答える

k8s クラスター環境を切り替えます。

 kubectl config use-context wk8s

SSH 経由で wk8s-node-0 ノードにログインし、最高の権限を取得します。

 ssh wk8s-node-0 sudo -i

kubelet のステータスを確認します。

 systemctl status kubelet

kubelet を再起動し、自動的に起動するように設定します。

 systemctl enable kubelet systemctl status kubelet


<<:  クラウド コンピューティングの近代化: 落とし穴、解決策、学んだ教訓

>>:  Kubernetes のコンテナタイプを調べる

推薦する

分散型のマルチアクティブ データ センターは、DNS ドメイン名解決と負荷分散をどのように実装するのでしょうか?

今日のトピックでは、アクティブ/アクティブ データ アクセスの観点から、ドメイン名解決と負荷分散につ...

第12回TOP100グローバルソフトウェアケーススタディサミットが北京で開催されました。

デジタル化とインテリジェンスの融合によってもたらされた競争の時代において、企業はサイクルを安全に乗り...

クラウドコンピューティングがビジネスの成功に不可欠な理由

あなたのビジネスは重要であり、可能な限り最善の方法で運営するためにあらゆる手段を講じる必要があります...

sparkvps: $25/年/KVM/2GB メモリ/25GB SSD/5TB トラフィック/ダラス/ニューヨーク

LEB からのメールを読んで、VPS ベンダーの sparkvps が、米国中部のダラスと米国東部の...

Baidu ニュース: Baidu 検索結果の新たな変更

昨夜、百度がアップデートした後、ウェブサイトの包含とバックリンクが増加し、百度の検索結果にも多くの変...

Baidu の入札は非常に強力ですが、SEO はどこに向かうべきでしょうか?

百度の入札力はこんなにも強いのか?SEOはどこへ向かうべきなのか?中国の現状から判断すると、百度は約...

タオバオの技術開発レビュー(第3部):Oracle/Alipay/Wangwang

オラクル/アリペイ/ワンワン  タオバオは個人のウェブサイトとしてはそれほど長い歴史はありません。し...

#DMCA なし# hostsolutions-30% 割引コード/VPS/専用サーバー/ルーマニア/著作権を無視

Hostsolutions は、今回もプロモーションを実施しています。今回は、VPS と SSD ハ...

Google、新しいブックマークサービス「Google Stars」を発表

Google は本日、長らく噂されていたブックマーク サービス「Google Stars」の開始を発...

オラクルは人事および人材管理プロセスを再構築し、人間味のある労働モデルを構築

オラクルは本日、求職者と従業員の高まる期待に組織が応えられるよう支援するため、Oracle Huma...

ウェブマスターの考え: すべてはランキングのせい

過去 2 年間、私はほとんどの時間を企業の Web サイトの最適化に費やしてきました。電子商取引、フ...

ウェブサイト運営について(1)

インターネット業界の発展により、基本的にあらゆる分野に独自の競合相手が存在します。小さな会社として始...

Baiduの経験から、検索の重みが高いのはSEO内部ページの最適化によるものだとわかる。

Baidu のウェイトプロモーションを行ったことがある友人は皆、Baidu で内部リンクと外部リンク...

Sina Weiboでウェブサイトを宣伝した経験

ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス遠くのラクダの鈴は私のブ...

A5の価値は、Baiduのニュースソースソフト記事の扱いからわかる

SEO の分野は、初期のキーワード設定から、外部リンクの交換、オリジナルまたは疑似オリジナルコンテン...