クラウドネイティブのコンテキストで JVM メモリを構成する方法

クラウドネイティブのコンテキストで JVM メモリを構成する方法

背景

少し前に、ビジネス開発チームから、アプリケーションのメモリ使用量が非常に高く、頻繁に再起動が発生しているとの報告があり、何が起こっているのか調べてほしいと依頼されました。

これまでこの問題にはあまり注目していなかったので、調査と分析のプロセスを記録しておきます。

まず、監視パネルで Pod の監視を確認しました。

確かにほぼ満杯であることがわかりましたが、アプリケーションの JVM 使用率を確認すると、約 30% しかありませんでした。これは、JVM OOM の原因となったのはアプリケーション メモリがいっぱいだったのではなく、Pod メモリがいっぱいだったために Pod メモリ オーバーフローが発生し、k8s によって強制終了されたことを示しています。

アプリケーションのレプリカ数を維持するために、k8s は Pod を再起動する必要があるため、一定時間実行した後にアプリケーションが再起動されるようです。

このアプリケーションは JVM 8G で構成されており、コンテナは 16G のメモリを要求するため、Pod のメモリ使用量は約 50% になるようです。

コンテナの原理

この問題を解決する前に、まずコンテナの動作原理について簡単に理解しておきましょう。なぜなら、k8s ではすべてのアプリケーションがコンテナ内で実行され、コンテナは基本的にホスト マシン上で実行される通常のアプリケーションだからです。

しかし、Docker を使用すると、各コンテナで起動されたアプリケーションが互いに干渉せず、ファイルシステム、ネットワーク、CPU、メモリが完全に分離され、まるで異なるサーバーで 2 つのアプリケーションが実行されているように感じられます。

実際のところ、これはブラックテクノロジーではありません。 Linux はバージョン 2.6.x 以降、長い間namespace分離をサポートしてきました。 namespaceを使用すると、2 つのプロセスを完全に分離できます。

単にリソースを分離するだけでは不十分で、CPU、メモリ、ディスク、帯域幅などのリソースの使用を制限することも必要です。これはcgroupsを使用して設定することもできます。

特定のプロセスのリソースを制限することができます。たとえば、ホストマシンに 4 コアの CPU と 8G のメモリがある場合、他のコンテナを保護するには、コンテナを 1 コアの CPU、2G のメモリという上限で構成する必要があります。

この図は、コンテナ テクノロジーにおける名前空間と cgroup の役割を明確に示しています。要するに:

  • 名前空間は分離を担う
  • cgroupは制限する責任がある

k8s にも対応する引き出しがあります:

 resources: requests: memory: 1024Mi cpu: 0.1 limits: memory: 1024Mi cpu: 4

このリソース リストは、アプリケーションがコンテナーに少なくとも 1 つの 0.1 コアと 1024M のリソースを割り当てる必要があり、最大 CPU 制限が 4 コアであることを示しています。

異なるOOM

この問題に戻ると、コンテナに OOM があり、それが k8s によって再起動されることを確認できます。これは制限を設定する目的でもあります。

k8s メモリ オーバーフローによりコンテナが終了した場合、終了コード 137 のイベント ログが表示されます。

アプリケーションの JVM メモリ構成はコンテナ構成サイズと同じであるため、両方とも 8 GB ですが、Java アプリケーションにはオフヒープ メモリなどの JVM 管理外のメモリも含まれており、コンテナ メモリ サイズが簡単に 8 GB の制限を超え、コンテナ メモリ オーバーフローが発生する可能性があります。

クラウドネイティブバックグラウンドの最適化

アプリケーション自体は多くのメモリを使用しないため、ヒープメモリを 4 GB に制限することをお勧めします。これにより、コンテナのメモリ制限を回避し、問題を解決できます。

もちろん、後でアプリケーション構成の列にも提案を追加します。JVM 構成はコンテナ制限の 2/3 未満にし、メモリを予約することをお勧めします。

実際のところ、本質は開発モデルが変わっていないということです。従来の Java アプリケーション開発モデルでは、すべてのアプリケーションが大容量メモリを搭載した仮想マシンにデプロイされていたため、コンテナのメモリ サイズさえもわからず、コンテナ メモリの制限を認識することができませんでした。

これは、追加の JVM が存在する Java アプリケーションでは特に顕著になる可能性があります。古いバージョンの JDK でも、ヒープ メモリ サイズが設定されていない場合、コンテナーのメモリ制限を感知できず、自動生成された Xmx がコンテナーのメモリ サイズよりも大きくなり、OOM が発生します。

<<:  クラウドネイティブとは何か、そしてクラウドネイティブアプリケーションの12の要素を理解する

>>:  Mobile Cloud と Venustech が共同で Mobile Cloud を開始 |ヴィーナステックセキュリティブランド

推薦する

SEO 最適化の究極の基準は何ですか?

武漢の一部の SEO 専門家の間では、「検索エンジンのルール」と「検索エンジンのアルゴリズム」という...

李嘉奇のトラフィックのおかげで、華熙子はどのようにして有名になったのでしょうか?

1. これは、スーパートラフィックスターがブランドを作り変える物語です。初期の頃、華西子は李佳琦をト...

Seoerが提起した物議を醸す質問への回答

多くのことはユニークでも絶対的でもないですが、SEO の技術や知識についても同じことが言えます。SE...

オリエンタルセレクションはライブストリーミング販売のボトルネックを打破できるか?

今年のライブストリーミング電子商取引界は、氷と火の世界と言えるでしょう。一方、かつてのライブストリー...

15日以内にホームページと内部ページにキーワードを取得する方法

多くの場合、多くの場所で、草の根ウェブマスターがウェブサイトの最適化について議論しているいくつかのト...

タイプミスの最適化マーケティングに関するいくつかの意見

今日、台湾の友人(michaec)とマーケティングの詳細についてチャットしていたとき、タイプミスを通...

人気ブランドマーケティング事例6選を分析!

インターネットの再編、ブランドの新たな動き。 Viya の倒産は年末のライブストリーミング電子商取引...

米国第2位の共同購入サイトがハッキングされ、5000万人のユーザーデータが流出

新浪科技ニュース:北京時間4月27日早朝のニュースで、米国第2位の共同購入サイトLivingSoci...

クラウドコンピューティングにはダモクレスの剣がかかっている

ここ数年、クラウド コンピューティングはテクノロジー業界の新たな寵児となっています。アマゾン、マイク...

データセンターの進化: ローカルコンピューティングからクラウド、エッジコンピューティングへ

今日の技術的に進歩した社会では、データセンターは現在の IT インフラストラクチャの不可欠な部分にな...

予算vm-E3 1230V2/16g メモリ/1T ハードディスク/30T トラフィック/5IP/月額 45 USD

budgetvm は、わずか 45 ドルで非常に強力な構成の特別なサーバーを立ち上げました。もちろん...

Tmall副社長独占インタビュー:プラットフォームのポリシーとアイデアを詳細に説明

最近、天下網の記者が天猫副社長の喬鋒氏にインタビューし、淘宝ブランド、伝統ブランド、海外の大手ブラン...

クラウドプラットフォームにおける人工知能の応用は2020年に爆発的な成長を示すだろう

アクセンチュアのアナリストは、2020 年に企業がより多くのイノベーションを獲得するのはクラウド プ...

クラウド関連の IoT 脅威を軽減する方法

モノのインターネット (IoT) は、デバイスやシステムが相互に通信し、データを交換できるようにする...

現在の状況で医療ウェブサイトはどのようにして Baidu でのランキングを最適化できるでしょうか?

検索エンジンのアルゴリズムが更新されて以来、多くの業界のウェブサイト、特に医療ウェブサイトはさまざま...