Kubernetes はバージョン 1.6 以降、5,000 を超えるノードをサポートできると主張していますが、数十から 5,000 までのノード数の増加に伴い、問題が発生することは避けられません。 この記事では、Kubernetes 5000 への道のりにおける Open API の経験、遭遇した問題、問題解決の試み、実際の問題の発見などについて説明します。
遭遇した問題とその解決方法 質問1: 1〜500ノード後 質問: kubectl がタイムアウトすることがあります (ps kubectl -v=6 ですべての API の詳細を表示できます) 解決を試みる:
理由: 上記の理由を除いて、マスター上の残りのサービス(etcd、kube-proxy)の確認を開始します。
質問2: ノードが約1000個ある場合 質問: kube-apiserverはetcdから毎秒500MBを読み込むことが判明した。 解決を試みる:
理由:
etcd のヒント: --etcd-servers-overrides を使用すると、Kubernetes イベント データをセグメントとして書き込み、異なるマシンで処理することができます (以下を参照)。
問題3: 1000~2000ノード 質問: これ以上データを書き込めません。エラーが連鎖的に発生しました kubernetes-ec2-autoscalerは、すべてのetcdが停止した後にのみ問題を返し、すべてのetcdをシャットダウンします。 解決を試みる:
解決:
各種サービスの最適化 Kubeマスターの高可用性 一般的に言えば、私たちのアーキテクチャは、kube-master (kube-apiserver、kube-scheduler、kube-control-manager を含む主要な Kubernetes サービス プロバイダー コンポーネント) と複数のスレーブで構成されます。ただし、高可用性を実現するには、次の方法を参照してください。
上記はKubernetesスケジューラを調整する例です。 InterPodAffinityPriority の重みを増やすことで、目標を達成できます。参考までに、その他の例もご覧ください。 現在の Kubernetes スケジューラ ポリシーは動的切り替えをサポートしておらず、kube-apiserver を再起動する必要があることに注意してください (問題: 41600) スケジューラポリシーの調整による影響 OpenAIはKubeDNSを使用していましたが、すぐに 質問: DNS クエリが頻繁に失敗する (ランダムに発生する) 約200QPS以上のドメイン検索 解決を試みる:
解決:
新しいノードを作成するときにDockerイメージのプルが遅くなる 質問: 新しいノードが構築されるたびに、Dockerイメージのプルに30分かかります 解決を試みる:
解決:
補足: ソーストレース
Dockerイメージのプル速度の向上 さらに、次の方法でプル速度を向上させることもできます。
ネットワークパフォーマンスの向上 フランネルのパフォーマンスの限界 OpenAIノード間のネットワークトラフィックは10~15GBit/sに達する可能性がありますが、Flannelによりトラフィックは2GBit/sまで低下します。 解決策は、フランネルを削除し、実際のネットワークを使用することです
|
>>: この記事では、「エッジコンピューティング」とモノのインターネットの密接な関係について説明します。
1. オンライン入札とは何ですか?簡単に言えば、入札とは、Baidu、Google、Soso、Sog...
ユーザーの「Gスポット」とは何でしょうか? ここでは、この G スポットを次のように定義します: ユ...
国内唯一のオンラインフェスティバル「ダブル12」期間中、dogyunは4つの波のアクティビティを開始...
[編集者注] Kubernetes の旅から得られた主な教訓。私たちは 2017 年にバージョン 1...
bluevmさん、512MメモリのKVMを年間25ドルで手に入れようとみんなが殺到したようですが、ま...
raksmartは新年に向けて大きなプロモーションを実施しており、特別オファーを提供しています:[1...
ハイブリッドクラウドの使用がますます増えています。過去 10 年間でハイブリッド クラウド、市場構造...
トラフィックを流したい人は、トラフィックが無制限の VPS が必要な場合もあります。readyded...
はじめに: 私たちは皆、WeiboとWeChatを使用していますが、プレイ、操作、構築は異なります。...
外部リンクに関しては、SEO に関係する人たちはよく知っています。外部リンクがウェブサイトの検索エン...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービスウェブサイトの最適化は簡...
テクノロジーの最もホットな分野であるクラウド コンピューティングは、デジタル時代におけるコミュニケー...
コストパフォーマンスと使いやすさに優れた「オルタナティブクラウド」サービスは、スタートアップ企業や中...
1. Tmallが目指すもの:販売プラットフォームからつながりプラットフォームへ天猫にとって、201...
「Fabの前身はFabulisというゲイ向けソーシャルネットワーキングサイトだった。Yelpのレビュ...