Java JVM の秘密を解明

この記事では、JVM メモリモデル、クラスローダー、GC 回復アルゴリズム、GC コレクターなど、JVM の分析に焦点を当て、全体的に理論に焦点を当てます。

この記事は初心者向けではなく、開発経験が 3 年以上ある技術者向けです。皆様のコミュニケーションと共有を歓迎します。記事に欠点があれば、読者はぜひ指摘してください。よろしくお願いします。

[[335548]]

1. jdk、jre、jvmの関係を明確にする

次の図は、公式サイトの jdk、jre、jvm のアーキテクチャ図です。このアーキテクチャ図から、次の 3 つの関係を簡単に確認できます。

（１）JDKにはJREが含まれ、JREにはJVMが含まれる

（２）JDKは主に開発環境で使用され、JREは主にリリース環境で使用されます。もちろん、リリース環境で JDK を使用しても問題はありませんが、パフォーマンスに若干影響が出る可能性があります。 JDK と JRE の関係は、プログラムのデバッグバージョンとリリースバージョンの関係に少し似ています。

（３）ファイルサイズに関しては、JDKはJREよりも大きいです。図からわかるように、jdk には、よく使用される javac、java コマンドなど、jre よりも 1 つ多くのツールキットがあります。

クラス2ローダー

jvm クラスローダーに関しては、次のように要約できます。

1. クラスローダーが必要なのはなぜですか?

（１）バイトコードファイルをランタイムデータ領域にロードする。 .java ソースコードが Javac コマンドによってコンパイルされた後に生成されたバイトコードファイル (.class) は、クラスローダーを介して jvm にロードされます。

（２）実行時にバイトコードファイルのデータ領域の一意性を判断する。同じバイトコードファイルは、異なるクラスローダーを通じて異なるファイルを形成します。したがって、実行時のバイトコードファイルのデータ領域の一意性は、バイトコードファイルとそれをロードするクラスローダーによって決まります。

2. クラスローダーの種類

クラスローダーは 4 つのカテゴリに分類できます。

（1）ブートストラップクラスローダー：このクラスローダーはクラスローダーの最上位レベルにあり、主に/jre/lib/rt.jarなどのJREコア関連のjarパッケージをロードします。

（2）拡張クラスローダー：このクラスローダーはクラスローダー階層の2番目のレベルにあり、主に/jre/lib/ext/*.jarなどのJRE拡張関連のjarパッケージをロードします。

(3) アプリケーションクラスローダーアプリ: このクラスローダーはクラスローダーの第3層に位置し、主にクラスパス(classpath)の下にある関連するjarパッケージをロードします。

（4）ユーザークラスローダー：このクラスローダーは、主にユーザーが指定したパス内の関連するjarパッケージをロードするユーザー定義のクラスローダーです。

3. クラスローダーメカニズム（親委任）

バイトコードのロードの場合、クラスのロードメカニズムは親の委任です。親の委任とは何ですか?

クラスローダーはバイトコードファイルを取得した後、それを直接ロードするのではなく、バイトコードファイルを直接の親クラスローダーに渡し、その直接の親クラスローダーはそれをさらに直接の親クラスローダーに渡し、これをルート親クラスローダーに渡します。ルート親ローダーの場合

ロードできる場合はロードされます。それ以外の場合は、ロードのために直接の子ローダーに渡されます。直接の子ローダーがロードできる場合は、ロードされます。そうでない場合は、その直接の子クラスローダーが順番にプッシュされます。いずれもロードできない場合は、最終的にはユーザー定義のクラスローダーによってロードされます。

4.JDK 1.8 でクラスローダーを実装するにはどうすればよいですか?

以下は再帰を使用したJDK 1.8クラスローダーの実装です。

保護されたクラス<?> loadClass(文字列名、ブール値解決)
        ClassNotFoundException をスローします
    {
        同期化 (getClassLoadingLock(名前)) {
            //まず、クラスがすでにロードされているかどうかを確認します
            クラス<?> c = findLoadedClass(名前);
            c == nullの場合{
                長いt0 = System.nanoTime();
                試す {
                    親がnullの場合
                        c = parent.loadClass(名前、 false );
                    }それ以外{
                        c = findBootstrapClassOrNull(名前);
                    }
                } キャッチ (ClassNotFoundException e) {
                    // クラスが見つからない場合は ClassNotFoundException がスローされます
                    // nullでない親クラスローダーから
                } 
 
                c == nullの場合{
                    //それでも見つからない場合は、 findClassを呼び出します 注文 
                    //クラスを見つけます。
                    長い t1 = System.nanoTime();
                    c = findClass(名前); 
 
                    // これは定義クラスローダーです。統計を記録する
                    sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
                    sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
                    sun.misc.PerfCounter.getFindClasses().increment();
                }
            }
            if (解決) {
                クラスを解決します(c);
            }
 cを返します。
        }
    }

5. 親の委任モデルの破壊

場合によっては、ロードスコープの制限により、親クラスローダーが必要なファイルをロードできないため、親クラスローダーは対応するバイトコードファイルをロードするために子クラスローダーに委任する必要があります。

たとえば、データベースドライバーインターフェイス Driver は JDK で定義されていますが、このインターフェイスの実装はさまざまなデータベースベンダーによって実装されているため、次の問題が発生します。

実行されたDriverManagerは、統一された管理を実現するためにDriverインターフェースを実装する関連実装クラスをロードする必要がありますが、Bootstrap ClassLoaderはjre/libの下にある対応するファイルのみをロードでき、

さまざまなメーカーによって実装された Dirver インターフェース実装クラス (Dirver 実装クラスは、Application ClassLoader によってロードされます)。この時点で、Bootstrap ClassLoader は、サブクラスローダーにドライバーをロードするよう委任する必要があります。

これを達成するために、親の委任モデルを破壊します。

3種類のライフサイクル

JVM における Java クラスのライフサイクルは、おおよそ 5 つの段階に分けられます。

1. ロードフェーズ: バイトコードバイナリストリームを取得し、静的ストレージ構造をメソッド領域のランタイムデータ構造に変換し、クラスのデータアクセスエントリとしてメソッド領域に対応するクラスオブジェクト (java.lang.Class オブジェクト) を生成します。

2. 接続フェーズ: このフェーズは、検証、準備、解析の3つのサブフェーズで構成されています。

（1）検証：バイトコードファイルが、メタデータ検証、ファイル形式の検証、バイトコード検証、シンボル検証などの仮想マシン仕様の要件に準拠していることを確認します。

（２）準備：静的テーブルにメモリを割り当て、JVMのデフォルト値を設定します。非静的変数の場合、この段階でメモリを割り当てる必要はありません。

（３）分析：定数プール内のシンボリック参照を直接参照に変換する

3. 初期化フェーズ: クラスオブジェクトが使用される前に必要な初期化作業

以下はブロガーからの引用ですが、非常に良い説明だと思います。

Java コードでは、静的フィールドを初期化する場合、宣言時に値を直接割り当てることも、静的コードブロック内で値を割り当てることもできます。

final static によって変更された定数を除き、直接代入操作と静的コードブロック内のすべてのコードは、Java コンパイラによって同じメソッド内に配置され、<clinit> という名前が付けられます。初期化の目的は、

定数値のフィールド割り当てと <clinit> メソッドの実行。 Java 仮想マシンはロックを使用して、クラスの <clinit> メソッドが 1 回だけ実行されるようにします。

どのような条件でクラスの初期化が行われますでしょうか?

（１）仮想マシン起動時に、ユーザが指定したメインクラス（メイン関数）を初期化する。

（２）新しいターゲットクラスのインスタンスを作成するための新しい命令に遭遇したとき、新しい命令のターゲットクラスを初期化する。

（３）静的メソッドを呼び出す命令に遭遇したときは、静的メソッドが配置されているクラスを初期化する。

（４）サブクラスの初期化は親クラスの初期化をトリガーする。

（５）インターフェースがデフォルトメソッドを定義している場合、そのインターフェースを直接または間接的に実装するクラスの初期化は、インターフェースの初期化をトリガーする。

（6）リフレクションAPIを使用してクラスをリフレクションする場合は、クラスを初期化します。

（７）MethodHandleインスタンスが初めて呼び出されると、MethodHandleが指すメソッドのクラスが初期化される。

4. 使用フェーズ: JVM でのオブジェクトの使用

5. アンロードフェーズ: オブジェクトを JVM からアンロードします。 JVM がクラスをアンロードする条件は何ですか?

（１）クラスをロードしたクラスローダーがリサイクルされた

（２）このクラスのインスタンスはすべてリサイクルされている

（３）このクラスに対応するjava.lang.Classオブジェクトはどこからも参照されていない

4つのJVMメモリモデル

1. JVM メモリモデルとは何ですか?

以下は、JVM メモリモデルアーキテクチャの図です。これまでの記事でも取り上げてきたので、ここでは一つ一つ説明せず、主にヒープ領域について解説します。

JDK 1.8 より前では、ヒープ領域は主に新しい世代、古い世代、永続的な世代に分かれていました。 JDK 1.8 以降では、永続世代が削除され、MetaSpace 領域が追加されました。ここでは、主に jdk 1.8 を共有します。

JDK 1.8 によれば、ヒープ領域のロジックは次の 3 つの部分に抽象化されます。

（１）新世代：エデン領域、S0領域（フロム領域とも呼ばれる）、S21（TO領域とも呼ばれる）を含む

（２）旧世代

（３）メタスペース

2. 新世代と旧世代のメモリサイズはどれくらいですか?

公式の推奨によれば、新しい世代が 3 分の 1 (Eden:S0:S1=8:1:1) を占め、古い世代が 3 分の 2 を占めるため、メモリ割り当て図は次のようになります。

3.GCリサイクルはどのように機能しますか?

オブジェクトはまずエデンエリア内を走ります。 Eden メモリがいっぱいになると、Eden は未使用のオブジェクトを再利用し、再利用されていないオブジェクトを s0 領域に配置するという 2 つの操作を実行します。このとき、s0 領域と s1 領域の名前が交換されます。つまり、s0->s1、s1->s0 となります。エデンエリアでオブジェクトをリサイクルすると、スペースが解放されます。次回 Eden がいっぱいになると、同じ手順がループで実行されます。 Eden 領域がリサイクルされると、残りのオブジェクトが s0 の容量を超えると、マイナー GC がトリガーされます。このとき、再利用されなかったオブジェクトは古い領域に配置され、ループで実行されます。 Eden 領域がマイナー GC をトリガーする場合、残りのオブジェクト容量が古い領域の残りの容量より大きい場合、古い領域はメジャー GC をトリガーし、この時点でフル GC がトリガーされます。通常、メジャー GC にはフル GC が伴うことに注意してください。フル GC はパフォーマンスに非常に悪影響を与えるため、JVM を調整するときは注意してください。

以下は、監視ツール VisualVM を使用して実稼働環境で取得した GC グラフです。

4. ガベージコレクションアルゴリズムとは何ですか?

（１）マークスイープアルゴリズム

アルゴリズムは、マーキングフェーズとクリアフェーズの 2 つのフェーズに分かれています。まず、リサイクル対象となるすべてのオブジェクトにマークを付け、次にマークされたオブジェクトをリサイクルします。このアルゴリズムは非効率であり、メモリの断片化が発生しやすくなります。

a.効率が低い: メモリを2回トラバースする必要がある。1回目はマークするため、2回目はマークされたオブジェクトをリサイクルするため。

b.非連続なメモリセグメントであるため、断片化が発生しやすくなります。オブジェクトが大きすぎる場合、Full GC が発生する可能性が高くなります。

次の図は、リサイクル前とリサイクル後のマークスイープアルゴリズムの比較図です。

（２）マークコピーアルゴリズム

このアルゴリズムは、「マークアンドスイープ」アルゴリズムの効率の低さとメモリの断片化の問題を解決します。メモリを同じサイズの 2 つのブロックに分割し、一度にそのうちの 1 つだけを使用します。ブロックの 1 つをリサイクルする必要がある場合、そのブロック内の残存オブジェクトを別のブロックにコピーし、そのメモリブロックを一度にクリーンアップするだけで、このサイクルを何度も繰り返すことができます。

次の図はリサイクル前とリサイクル後のマークコピーアルゴリズムの簡単な図です。

ただし、若い世代のほとんどのオブジェクトの滞留時間は非常に短く、オブジェクトの 98% はすぐにリサイクルされ、生き残るオブジェクトは非常に少ないため、メモリを 1:1 に分割する必要はなく、8:1:1 に分割する必要があります。

生き残った 2% のオブジェクトを s0 (ゾーンから) に配置するだけです。

以下は、Eden:s0:s1 =8:1:1によるパーティションの概略図です。

（３）マーククリアアルゴリズム

アルゴリズムは、マーキングとソートの 2 つの段階に分かれています。まず、生き残ったすべてのオブジェクトがマークされ、これらのオブジェクトは一方の端に移動され、次に終了境界の外側のメモリが直接クリーンアップされます。古い世代のオブジェクトはより長く存続するため、このアルゴリズムはそれらに適しています。

マーキングプロセスは依然として「マークアンドスイープ」プロセスと一致していますが、後続の手順では、リサイクル可能なオブジェクトを直接クリーンアップするのではなく、残っているすべてのオブジェクトを一方の端に移動し、終了境界の外側のメモリを直接クリーンアップします。

以下は、「マークソートアルゴリズム」の回収期間と回収後の概略図である。

（４）世代別コレクションアルゴリズム

このアルゴリズムは、世代の考え方を採用した現在の JVM アルゴリズムです。モデルは次のとおりです。

5.一般的な GC コレクターは何ですか?

(1)シリアルGC

SerialGC はシリアルコレクターとも呼ばれ、最も基本的な GC コレクターです。主にシングルコアCPUに適しています。新しい世代ではコピーアルゴリズムが使用され、古い世代ではマーク圧縮アルゴリズムが使用されます。操作中にアプリケーションを一時停止する必要があります。

これにより STW 問題が発生し、JVM アノテーションパラメータは -XX:+UseSerialGC になります。

(2)並列GC

ParallelGC は SerialGC に基づいています。主に SerialGC のシリアル問題を解決し、それを並列問題に変更し、マルチスレッド問題を解決しますが、STW 問題も発生します。 JVM の主なパラメータは次のとおりです。

a.-XX:+UseParNewGC、これは新しい世代が並列（コピーアルゴリズム）であり、古い世代がシリアル（マーク圧縮）であることを意味します。

b.XX:+UseParallelOldGC、旧世代も並列です

（３）CMSGC

CMSGC は、「マークスイープアルゴリズム」を使用する旧世代のコレクターであり、STW の問題は発生しません。 JVM のパラメータ設定は次のとおりです。

-XX:+UseConcMarkSweepGC、古い世代がCMSコレクターを使用することを示します

(4)まずゴミから

Garbage First は、短い一時停止の要件を満たしながら高いスループットを実現する JVM ガベージコレクターです。マルチコア CPU と大容量メモリを搭載したサーバーに適しており、JDK9 のデフォルトのガベージコレクターでもあります。

5. 結論

JVM メモリモデルは、jdk、jre、jvm の関係、jvm クラスローダー、jvm ヒープメモリ分割、GC コレクター、GC リサイクルアルゴリズムなどに重点を置いて深く分析されています。全体的なアプローチは理論に偏っています。スペースの制限により、この記事ではこれらのテクノロジが実際の JVM チューニングでどのように使用されるかについては分析しませんが、これについては次の記事で紹介します。

<<: CIOがマネージドクラウドサービスプロバイダーの新たなベンチマークを設定

>>: 「数秒で理解できます！」 JVM 仮想マシンの詳細なグラフィックとテキストの説明!全然難しくない