Kubernetes はバージョン 1.6 以降、5,000 を超えるノードをサポートできると主張していますが、数十から 5,000 までのノード数の増加に伴い、問題が発生することは避けられません。 この記事では、Kubernetes 5000 への道のりにおける Open API の経験、遭遇した問題、問題解決の試み、実際の問題の発見などについて説明します。
遭遇した問題とその解決方法 質問1: 1〜500ノード後 質問: kubectl がタイムアウトすることがあります (ps kubectl -v=6 ですべての API の詳細を表示できます) 解決を試みる:
理由: 上記の理由を除いて、マスター上の残りのサービス(etcd、kube-proxy)の確認を開始します。
質問2: ノードが約1000個ある場合 質問: kube-apiserverはetcdから毎秒500MBを読み込むことが判明した。 解決を試みる:
理由:
etcd のヒント: --etcd-servers-overrides を使用すると、Kubernetes イベント データをセグメントとして書き込み、異なるマシンで処理することができます (以下を参照)。
問題3: 1000~2000ノード 質問: これ以上データを書き込めません。エラーが連鎖的に発生しました kubernetes-ec2-autoscalerは、すべてのetcdが停止した後にのみ問題を返し、すべてのetcdをシャットダウンします。 解決を試みる:
解決:
各種サービスの最適化 Kubeマスターの高可用性 一般的に言えば、私たちのアーキテクチャは、kube-master (kube-apiserver、kube-scheduler、kube-control-manager を含む主要な Kubernetes サービス プロバイダー コンポーネント) と複数のスレーブで構成されます。ただし、高可用性を実現するには、次の方法を参照してください。
上記はKubernetesスケジューラを調整する例です。 InterPodAffinityPriority の重みを増やすことで、目標を達成できます。参考までに、その他の例もご覧ください。 現在の Kubernetes スケジューラ ポリシーは動的切り替えをサポートしておらず、kube-apiserver を再起動する必要があることに注意してください (問題: 41600) スケジューラポリシーの調整による影響 OpenAIはKubeDNSを使用していましたが、すぐに 質問: DNS クエリが頻繁に失敗する (ランダムに発生する) 約200QPS以上のドメイン検索 解決を試みる:
解決:
新しいノードを作成するときにDockerイメージのプルが遅くなる 質問: 新しいノードが構築されるたびに、Dockerイメージのプルに30分かかります 解決を試みる:
解決:
補足: ソーストレース
Dockerイメージのプル速度の向上 さらに、次の方法でプル速度を向上させることもできます。
ネットワークパフォーマンスの向上 フランネルのパフォーマンスの限界 OpenAIノード間のネットワークトラフィックは10~15GBit/sに達する可能性がありますが、Flannelによりトラフィックは2GBit/sまで低下します。 解決策は、フランネルを削除し、実際のネットワークを使用することです
|
>>: この記事では、「エッジコンピューティング」とモノのインターネットの密接な関係について説明します。
1. K8S管理コンソールKubernetes Web UI (または Kubernetes ダッシ...
ショートビデオ、セルフメディア、インフルエンサーのためのワンストップサービス世界で最初のインターネッ...
百度鉄破は百度製品の中で最もトラフィックが多い製品の一つであり、百度が成功させた数少ないプロジェクト...
raksmart は、香港、韓国、日本、シンガポールにオプションのデータセンターを備えた、アジアの高...
私はSEOを2年以上やっています。最初は人気ワードが多かったので大変だと感じましたが、最終的にはもう...
[[422599]]要点アマゾン・ドット・コムのクラウドコンピューティング部門はサービス別の粗利益を...
電子商取引戦争の火花は次第に消えていったが、業界内の争いはまだまだ終息していない。価格比較サイトが8...
joes-cloud は道徳的誠実さを放棄し、最初の 2 か月間の低価格プロモーションの割引コード ...
5G時代の到来により、さまざまな業界のトラフィックが爆発的な増加を遂げており、特にビデオ業界はインタ...
ロイター通信によると、韓国政府は木曜日、中国政府がテロ対策の一環としてモバイルチャットアプリ「カカオ...
1.4.2 エントリーファイル(1)このセクションでは、まずシステムの複数のリクエスト エントリ設計...
LBXU#罗罗データ据は現在、メーデーの爽やかな夏のイベントを推進しており、月払いの場合は20%オフ...
医療業界のネットワークチーム構成:医療業界のSEO競争は非常に激しいと昔から聞いていましたが、今年つ...
豆板創始者阿倍氏(右) Doubanの創設者Abeiは、Geek Park Innovation C...
3月27日、北京でSmartisan ROMの発表会が開催され、創設者のLuo Yonghao氏が主...