仮想マシンバイトコード実行エンジン

仮想マシンバイトコード実行エンジン

いわゆる「仮想マシン バイトコード実行エンジン」は、実際には、クラス ファイルに指定されたバイトコード命令に従って JVM のスタック インタープリターに基づく実行メカニズムです。簡単に言えば、JVM がバイトコード命令を解析し、実行結果を出力するプロセスです。次に、この部分を詳しく見てみましょう。

[[224954]]

メソッド呼び出しの性質

「バイトコード実行エンジン」について説明する前に、まずスタック フレーム ベースのメソッド呼び出しがアセンブリ レベルからどのように機能するかを見てみましょう。 (IA32 CPU命令セットを例に挙げます)

スタック フレーム データ構造は、IA32 プログラムでプロシージャ呼び出し (Java 言語ではメソッドと呼ばれる) をサポートするために使用されます。各プロシージャはスタック フレームに対応し、プロシージャ呼び出しはスタック フレームのプッシュとポップに対応します。ある瞬間には、スタックの最上部にあるスタック フレームのみが使用可能であり、これは実行中のメソッドのさまざまな状態を表します。最上位のスタック フレームは、スタック ポインターとフレーム ポインターの 2 つのポインターによって定義されます。これらは、それぞれレジスタ %ebp と %esp に格納されているスタック上のアドレスに対応します。スタックの一般的な構造は次のとおりです。

スタック ポインターは常にスタックの最上位要素を指し、スタック内の要素のエントリと終了を制御します。フレーム ポインターは、現在のスタック フレームの下部を指します。これはスタック全体の一番下ではなく、現在のスタック フレームであることに注意してください。

C コードの一部を見てみましょう。

  1. #include <stdio.h>
  2. void sayHello( int年齢)
  3. {
  4. 整数x = 32;
  5. 整数y = 2323;
  6. 年齢 = x + y;
  7. }
  8.  
  9. void main()
  10. {
  11. 年齢= 22;
  12. sayHello(年齢);
  13. }

これは非常に単純なコードです。いくつかのリンク コードを省略し、コア部分を残しながら、対応するアセンブリ コードをアセンブルして生成します。

  1. 主要:
  2. プッシュ %ebp
  3. %esp、%ebp を移動
  4. サブ $20、%esp
  5. 移動 $22、-4(%ebp)
  6. 移動 -4(%ebp), %eax
  7. %eax を移動します (%esp)
  8. こんにちはと電話する
  9. 離れる
  10. 戻る
  11.      
  12. こんにちは:
  13. プッシュ %ebp
  14. %esp、%ebp を移動
  15. サブ $16、%esp
  16. 移動 $32、-4(%ebp)
  17. 移動 $2323、-8(%ebp)
  18. 移動 -8(%ebp), %eax
  19. 移動 -4(%ebp), %edx
  20. %edx、%eax を追加
  21. 移動 %eax, -12(%ebp)
  22. 離れる
  23. 戻る

まず、メイン関数のアセンブリ コードを見てみましょう。 main 関数の最初の 2 つのアセンブリ命令は sayHello の最初の 2 つの命令と同じなので、後者でそれらを紹介します。

subl 命令はレジスタ %esp のアドレスから 20 を減算します。これは、スタック ポインターが 20 バイト上方に拡張される (スタックが後方に拡張される)、つまり、現在のスタック フレームに 20 バイトが割り当てられることを意味します。次に、movl は値 20 をアドレス -4 (%ebp) に書き込みます。これは、レジスタ %ebp を基準としたフレーム ポインター位置の 4 バイト上にあります。 %ebp の値が 0x14 の場合、スタック アドレス 0x10 に 20 が格納されます。

次に、movl 命令はパラメータ age の値を取得し、それをレジスタ %eax に格納します。

ここでコア呼び出しメソッドが登場します。コンピュータには、次の命令の位置を指すプログラム カウンター (PC) があり、プログラムは他のメソッドを呼び出すことがよくあります。では、呼び出し前の状態を復元し、呼び出しが完了した後に実行を継続するにはどうすればよいでしょうか?

ここでの解決策は、呼び出し命令の最初のステップで戻りアドレスをスタックにプッシュし、実行のために sayHell メソッドにジャンプすることです。ここでは、スタック プッシュ プロセスが 1 つの命令に統合されているため、スタック プッシュ プロセスを見ることはできません。

次に、sayHello メソッドの最初の命令にジャンプして実行を開始します。 pushl はレジスタ %ebp のアドレスをスタックにプッシュします。このとき、%ebp は前のスタック フレームのフレーム ポインタ アドレスになります。この操作は実際には保存アクションです。次に、movl 命令はフレーム ポインターをスタックの先頭であるスタック ポインターの位置にポイントし、スタック ポインターを 16 バイト上方に拡張します。

次に、値32と2323が異なるスタックアドレスに書き込まれます。フレーム ポインターに対する相対アドレスを計算できます。

後続の操作では、x と y をそれぞれレジスタ %eax と %edx に書き込み、次に add 命令で加算操作を実行して、それをレジスタ %eax に格納します。結果はスタックにプッシュされます。

離脱命令は、次の 2 つの命令の合計に相当します。

  1. 移動 %ebp %esp
  2. ポピュラー%ebp

それはどういう意味ですか?

スタック ポインターを、現在のスタック フレームの一番下であるフレーム ポインターの位置に戻し、スタックをポップします。この方法では、sayHello 全体が占有するスタック フレームは参照できなくなり、これは現在のスタック フレームを解放することと同じです。

ret 命令は、呼び出し前の状態を復元し、メイン メソッドの実行を継続するために使用されます。

IA32 メソッド呼び出し全体は基本的に上記のようになります。 64 ビット x86-64 では、16 個のレジスタが追加され、パラメータの計算と転送に最初にレジスタが使用されるため、効率が向上します。ただし、このスタックベースの保存方法と比較すると、「移植性が低い」という欠点があり、異なるマシン上のレジスタの使用方法が確実に異なります。したがって、Java は間違いなくスタックを使用します。

ランタイムスタックフレーム構造

Java では、1 つのスタック フレームが 1 つのメソッド呼び出しに対応し、メソッドに関係するローカル変数、オペランド、戻りアドレスなどはすべてスタック フレームに格納されます。各メソッドに対応するスタック フレームのサイズは、基本的にコンパイル後に決定されます。メソッド内で必要なローカル変数テーブルの大きさやオペランド スタックの深さなどの情報は、メソッドの Code 属性にすでに書き込まれています。したがって、実行時にはメソッドのスタック フレーム サイズが既に固定されており、メモリを直接計算して割り当てることができます。

ローカル変数テーブル

ローカル変数テーブルは、メソッドの実行中に使用されるさまざまな変数とメソッド パラメータを格納するために使用されます。仮想マシンの仕様では、ローカル変数テーブルの容量は変数スロットを最小単位として使用すると規定されていますが、スロットの実際のスペース サイズは指定されていません。各スロットには、boolean、byte、char、short、int、float、reference などを格納できる必要があるとだけ書かれています。

私の理解では、スロットはブラックボックスに相当します。占有する具体的なバイト数は状況によって異なりますが、このブラック ボックスには明らかにあらゆるタイプの変数を格納できます。

ローカル変数テーブルはオペランド スタックとは異なります。要素にアクセスするためにインデックス メカニズムを使用しますが、これはオペランド スタックに入る方法と出る方法とは異なります。例えば:

  1. パブリックvoid sayHello(文字列){
  2. 整数x = 23;
  3. 整数y = 43;
  4. ++;
  5. x=y−2;
  6. 長いz = 234;
  7. x = ( int )z;
  8. 文字列 str = new String( "hello wrold " );
  9. }

逆コンパイルしてローカル変数テーブルを見てみましょう。

ご覧のとおり、ローカル変数テーブルの最初のエントリは this と呼ばれるクラス参照であり、ヒープ内の現在のオブジェクトへの参照を指します。次に、メソッド パラメーター、ローカル変数 x、y、z、str が続きます。

これは実際には、各インスタンス メソッドがデフォルトでパラメーター this を渡し、それが現在のクラスのインスタンス参照を指すことを間接的に示しています。

オペランドスタック

オペランド スタックは、操作スタックとも呼ばれます。ローカル変数テーブルとは異なり、要素にアクセスするためにインデックス メカニズムは使用されず、標準のスタック操作、プッシュとポップ、先入れ先出しが使用されます。メソッド実行の開始時にはオペランド スタックは空です。メソッドがステップごとに実行されると、メソッドの実行が終了するまで、オペランド スタック内でプッシュ操作とポップ操作が継続して発生します。

オペランド スタックは、メソッド実行プロセスの非常に重要な部分です。メソッド実行プロセスのすべての中間結果は、オペランド スタックを使用して保存する必要があります。

返送先住所

メソッドが別のメソッドを呼び出した後、後続のメソッド本体の実行を継続するには、呼び出しポイントに戻る必要があります。そして、他のメソッドが呼び出される場所は「戻りアドレス」と呼ばれます。 CPU が他のメソッドを実行した後に元の呼び出しポイントに戻り、呼び出し元のメソッド本体を続行できるようにするには、特定の手段を使用する必要があります。

冒頭で紹介したアセンブリ コードと同様に、この戻りアドレスは、多くの場合、呼び出し元のスタック フレームに事前にプッシュされます。メソッド呼び出しが終了すると、スタックの一番上の要素が取り出され、後続のメソッド本体の実行エントリが取得されます。

メソッド呼び出し

メソッド呼び出しはこの記事の中心的な内容です。多くの場合、仮想マシン命令は特定のメソッドの呼び出しを必要としますが、そのメソッドにはオーバーロードや上書きなどの問題がある場合があるため、仮想マシンがターゲットの呼び出しメソッドを決定する問題を解決します。では、仮想マシンはどのメソッドを呼び出すかをどのように決定するのでしょうか?これは、この段階で処理される唯一のタスクです。

まず、解析プロセスについて説明する必要があります。前回の記事から、クラスが初めてロードされるときに、定数プール内のシンボリック参照を直接参照に置き換える処理が解析フェーズ中に完了することがわかります。これには、メソッドのシンボリック参照を直接参照に変換するプロセスが含まれますが、これは一部のメソッドにのみ適用されます。一部のメソッドは実行時にのみ決定され、解決されません。クラス読み込みフェーズ中の解析プロセスを「静的解析」と呼びます。

では、どのメソッドが静的に解決され、どのメソッドが動的に解決される必要があるのでしょうか?

たとえば、次のコード:

  1. オブジェクト obj = new String( "hello" );  
  2. obj.equals( "世界" );

Object クラスには equals メソッドがあり、String クラスにも equals メソッドがあります。上記のプログラムは明らかに String の equals メソッドを呼び出します。したがって、Object クラスをロードし、equals シンボル参照をそのクラス自身の equals メソッドの直接参照に直接ポイントすると、上記の obj は常に Object の equals メソッドを呼び出します。そうすると、多態性は決して実現されなくなります。

クラスのロード時に静的に解析できるのは、「コンパイル時に既知で、実行時に変更されない」メソッドのみです。これらのメソッドには主に、private によって変更された private メソッド、クラスの静的メソッド、クラス インスタンス コンストラクター、および親クラスのメソッドが含まれます。

その他のすべてのメソッドは総称して「仮想メソッド」と呼ばれ、クラス読み込みの解析フェーズでは解析されません。これらのメソッドを呼び出すことに問題はありません。仮想マシンは、直接参照に基づいてメソッドのエントリを見つけることができます。しかし、「非仮想方式」は異なります。仮想マシンは、実際のメソッドを見つけるために特定の戦略を使用する必要があります。見てみましょう。

静的ディスパッチ

まず、コードの一部を見てみましょう。

  1. パブリッククラス Father {
  2. }
  3. パブリッククラスSonはFatherを拡張します{
  4. }
  5. パブリッククラスDaughterはFatherを拡張します{
  6. }
  7.  
  8.  
  9. パブリッククラスHello {
  10. public void sayHello(父 父){
  11. システム。 out .println( "こんにちは、私は父親です" );
  12. }
  13. public void sayHello(娘 娘){
  14. システム。 out .println( "こんにちは、私は娘です" );
  15. }
  16. パブリックvoid sayHello(Son son){
  17. システム。 out .println( "こんにちは、私は息子です" );
  18. }
  19. }
  20.  
  21.  
  22. 公共 静的void main(String[] args){
  23. 父の息子 = 新しい息子();
  24. 父娘 = 新しい娘();
  25. こんにちは hello = new Hello();
  26. こんにちは。こんにちはと言います(息子)。
  27. hello.sayHello(娘);
  28. }

出力は次のようになります。

  1. こんにちは、私は父親です 
  2. こんにちは、私は父親です

答えは正しかったでしょうか?これは非常に一般的な面接の質問であり、メソッドのオーバーロードとメソッドのディスパッチ ロジックに関する理解をテストします。以下で分析してみましょう:

まず、「静的型」と「実型」という 2 つの概念を導入する必要があります。静的型とは、変数の最外層にラップされた型を指します。たとえば、上で述べた父親はいわゆる静的なタイプですが、息子や娘は実際のタイプです。

コンパイラはバイトコード命令を生成するときに、変数の静的型に基づいて適切なメソッドを呼び出すことを選択します。上記の例では、次のようになります。

これら 2 つのメソッドは、メイン関数で 2 回呼び出される sayHello メソッドですが、渡されるパラメーターの型は同じ Father であることがわかります。つまり、呼び出されるメソッドは同じで、どちらも次のメソッドです。

  1. (LStaticDispathch/父;)V

つまり

  1. public void sayHello(父 父){}

メソッド実行バージョンを特定するために静的型に依存するすべてのディスパッチ アクションは「静的ディスパッチ」と呼ばれ、メソッドのオーバーロードは静的ディスパッチの典型的な表現です。ただし、静的ディスパッチでは実際の型は考慮されず、静的型に基づいてメソッド呼び出しのみが実行されることに注意してください。

ダイナミックディスパッチ

  1. パブリッククラス Father {
  2. パブリックvoid sayHello(){
  3. システム。 .println ( "hello world ---- father" );
  4. }
  5. }
  6. パブリッククラスSonはFatherを拡張します{
  7. @オーバーライド
  8. パブリックvoid sayHello(){
  9. システム。 .println ( "hello world ---- son" );
  10. }
  11. }
  12.  
  13.  
  14. 公共 静的void main(String[] args){
  15. 父の息子 = 新しい息子();
  16. 息子はこんにちはと言います。
  17. }

出力:

  1. こんにちは世界---- 息子 

当然、サブクラスの sayHello メソッドが最後に呼び出されます。生成されたバイトコード命令呼び出しを見てみましょう。

見ましたか?コンパイラによって生成されたメソッド呼び出し命令は、静的型の対応するメソッドを呼び出すことを選択しますが、最終結果が実際の型の対応するメソッドを呼び出すのはなぜでしょうか?

型インスタンスの特定のメソッドを呼び出すときは、まず現在のインスタンスをオペランド スタックにプッシュし、次に、invokevirtual 命令で次の手順を完了してメソッドを呼び出す必要があります。

  • オペランドスタックの一番上の要素をポップし、その実際の型(Cと表記)を決定する。
  • 呼び出されるメソッドと同じ単純名と記述子を持つ C 型のメソッドを検索し、存在する場合はメソッドへの直接参照を返します。
  • それ以外の場合は、C の親クラスを再度検索し、見つかった場合はメソッドへの直接参照を返します。
  • それ以外の場合は、java.lang.AbstractMethodError 例外がスローされます。

したがって、ここでの例ではサブクラス Son の sayHello メソッドを呼び出していることは自明です。

仮想マシンがクラス内の指定されたメソッドをなぜ正確かつ効率的に検索できるのかについては、仮想マシンごとに実装が異なりますが、最も一般的なのは「仮想メソッド テーブル」を使用していることです。この概念も比較的単純で、各タイプごとにメソッド テーブルが維持され、現在のタイプのすべてのメソッドの説明情報が記録されます。したがって、仮想マシンがメソッドを取得するときは、メソッド テーブルから検索するだけで済みます。現在のタイプのメソッド テーブルにメソッドが含まれていない場合は、親クラスのメソッド テーブルを検索します。

動的型機能のサポート

動的型付け言語の主な特徴は、実行時に型チェックが行われることです。つまり、コンパイル中、コンパイラは変数の型や、呼び出すメソッドが存在するかどうかを気にしません。例えば:

  1. オブジェクト obj = new String( "hello-world" );
  2. obj.split( "-" );

Java では、変数 obj の静的型が Object であることをコンパイラがチェックし、Object クラスに subString メソッドがないため、この 2 行のコードはコンパイラを通過できず、エラーが報告されます。

動的型付け言語であれば、このコードは問題ありません。

静的言語はコンパイル時に変数の型をチェックし、厳密なチェックを提供しますが、動的言語は実行時に変数の実際の型をチェックし、プログラムの柔軟性を高めます。それぞれに長所と短所があります。静的言語の利点はセキュリティであり、欠点は柔軟性の欠如です。動的言語の場合はその逆になります。

JDK1.7 では、Java の動的機能をサポートするために、invokedynamic 命令と java.lang.invoke パッケージという 2 つの方法が提供されています。両者の実装方法は類似しており、後者の基本的な内容のみを紹介します。

  1. //このメソッドはinvokeパッケージではなく私がカスタマイズしたものです
  2. 公共 静的MethodHandle getSubStringMethod(Object obj)はNoSuchMethodException、IllegalAccessExceptionをスローします{
  3. //検索するメソッドの戻り値とパラメータの型を指定するメソッドテンプレートを定義します
  4. メソッドタイプ methodType = MethodType.methodType(String[].class,String.class);
  5. //指定されたメソッドの単純な名前とテンプレート情報に一致するメソッドを検索します
  6. lookup().findVirtual(obj.getClass(), "split" ,methodType).bindTo(obj);を返します
  7. }
  1. 公共 静的void main(String[] args){
  2. オブジェクト obj = new String( "hello-world" );
  3. //Location メソッドを実行し、メソッドを実行するためのパラメータを渡す
  4. String[] strs = (String[]) getSubStringMethod(obj).invokeExact( "-" );
  5. システム。出力.println(strs[0]);
  6. }

出力:

  1. こんにちは

ご覧のとおり、obj の静的型は Object ですが、この方法ではコンパイラの型チェックをバイパスし、実行時に指定したメソッドを直接実行できます。

非常に複雑なので、具体的な実装方法は説明しません。機会があれば、それについて学ぶための別の記事を書きます。いずれにせよ、この方法では、変数の静的型を気にする必要はありません。呼び出したいメソッドがあれば、実行時に直接呼び出すことができます。

要約すると、HotSpot 仮想マシンはオペランド スタックに基づいてメソッドを解釈して実行します。基本的に、操作の中間結果やメソッド パラメータなどはすべて、スタックへの入出力操作とともに取得または保存されます。このメカニズムの最大の利点は、その優れた携帯性です。レジスタベースの実行メカニズムとは異なり、基盤となるハードウェアに大きく依存するため、クロスプラットフォーム化が容易ではありません。しかし、その欠点も明らかです。つまり、同じ操作を完了するには、比較的多くの命令が必要になります。

<<:  仮想マシン保護技術についてお話しましょう

>>:  NFV におけるクラウドネイティブ VNF の重要性

推薦する

PPSとiQiyiは買収の噂を否定

北京時報(記者:顧孟林 李斌)昨日、一部メディアは、百度傘下の動画サイト「iQiyi」が百度を通じて...

クラウドコンピューティングベースのITビジネスは急速に成長している

従来のデータ センター システムを使用する企業は、ファイアウォールの外側のシステムによる IT 資産...

ビジネス戦争と紛争:ケータリングO2Oが世界を征服し、市場シェアをめぐる戦いを開始

O2Oは間違いなく中国の電子商取引市場におけるダークホースであり、近年の急速な拡大と成長は中国のO2...

企業ウェブサイト構築の第一選択は、インターネットの時代に入り、インテリジェントなウェブサイト構築ソフトウェアです。

2018年最もホットなプロジェクト:テレマーケティングロボットがあなたの参加を待っていますインターネ...

ウェブマスター対百度:あなたは本当に私の心を理解していない

記事も長い間書いてないし、ブログも長い間更新してない。ちょっと退廃的な気分です。ハハ、今日は仕事が終...

仮想化とそれが直面するセキュリティ問題についての簡単な説明

仮想マシンがなければ、単一のオペレーティング システムがすべてのハードウェア リソースを占有しますが...

どのようなブランドマーケティングプロモーションプランが皆を魅了するのでしょうか?

ブランドマーケティングは、高度なマーケティング手法です。ブランドマーケティングとは、消費者の製品に対...

weloveservers-50G ハードディスク/無制限のウェブサイト構築/1T トラフィック/仮想ホスト/年間 5 USD の支払い

weloveservers は、ほぼ 1 年前からある新しい VPS プロバイダーです。最も有名なの...

WeChatインタラクティブマーケティング運用テンプレート設定戦略

WeChat インタラクティブ マーケティングの別の言い方は、実際には感情マーケティングです。これは...

ウェブマスターネットワークニュース:Kuaiboのボスである王欣は1か月近く行方不明になっており、彼の妻はトイレに隠れて現れていない

1. Qvodの社長である王欣は1か月近く行方不明になっており、妻は浴室に隠れたまま姿を現していない...

フォーラム管理には革新的な考え方を取り入れる必要があります。フォーラム管理を革新する方法

フォーラムの管理は、常にモデレーターにとって大きな問題でした。モデレーターの考えは、管理が厳しすぎる...

Google、写真アプリ「Google フォト」をリリース

5月29日、北京時間早朝、Googleは米国サンフランシスコで年次開発者会議を開催した。会議で、Go...

SEO 442 ルール: マーケティング全体の状況を自分の手で管理する

電子商取引の運営には442ルールがあります。つまり、成功の 40% はマーケティングターゲット、40...

最も収益性の高いモバイルインターネット企業30社が発表、ゲーム企業が主力

我が記者顧暁宇は昨日、フォーブス誌の中国版が2011年に最も利益を上げたモバイルインターネット企業3...