心安

深入理解Java虚拟机(二) -- 虚拟机类加载机制

字数统计: 3.1k阅读时长: 10 min
2019/03/03 Share

前言

虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。

与那些在编译时需要进行连接工作的语言不同,在Java语言里面,类型的加载、连接和初始化过程都是在程序运行期间完成的,这种策略虽然会令类加载时稍微增加一些性能开销,但是会为Java应用程序提供高度的灵活性。Java里天生就可以动态扩展的语言特性就是依赖运行期动态加载和动态连接这个特点实现的。

类加载的时机

类从被加载到虚拟机的内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中验证、准备、解析这3个部分统称为连接(Linking),如下图所示:

上图中,加载、验证、准备、初始化和卸载这5个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定,它在某些情况下可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定(也称为动态绑定或者晚期绑定)。
注意,这里说的按部就班的开始不等同于按部就班的完成。也就是说并不要求上一阶段完成才能进行下一阶段,因为这些阶段通常都是相互交叉混合式进行的,通常会在一个阶段执行的过程中调用、激活另一个阶段。

Java虚拟机规范并没有对何时执行加载过程进行约束,但是对于初始化这个过程,却严格的规定了有且仅有以下5种情况必须立即对类进行“初始化”。

  1. 遇到newgetstaticputstatic或者invokestatic这4条字节码指令时,如果类没有进行初始化,则需要先触发其初始化。生成这4条指令的最常见的Java代码场景是:使用new关键字实例化对象时、读取或设置一个类的静态字段时(final修饰的除外,静态常量在编译期就会被放入常量池)、调用一个类的静态方法时。

  2. 使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。

  3. 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化(接口例外,只有在子接口使用了父接口的时候才需要父接口初始化)。

  4. 当虚拟机启动时,用户需要制定一个要执行的主类,即包含main()方法的那个类,虚拟机会先初始化这个主类。

  5. 当使用JDK7的动态语言支持时(可以简单理解为lambda表达式),如果一个java.lang.invoke.MethodHandle实例最后的解析结果是REF_getStaticREF_putStaticREF_invokeStatic的方法句柄,并且这个方法句柄所对应的类还没有进行过初始化,则需要先触发初始化。

除了上面的情况以外,所有的引用类的方式都不会触发初始化,称为被动引用,请看下面的测试用例。

测试用例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
public class SuperClass {

public static int value = 123;

static {
System.out.println("super class init");
}
}

class SubClass extends SuperClass {

public static final int VALUE = 1234;

static{
System.out.println("sub class init");
}
}

class Example {
public static void main(String[] args) {
System.out.println(SubClass.value);
System.out.println(SubClass.VALUE);
SubClass[] subClasses = new SubClass[10];
}
}

输出结果:

1
2
3
super class init
123
1234

并没有输出“sub class init”也就意味着上面所有的情况都不会初始化SubClass类。

  1. 通过子类引用父类的静态字段,只会触发父类初始化,子类不会初始化。

  2. 数组类型引用了一个类,不会导致该类初始化,只有在真正使用的时候才会初始化。

  3. 引用一个类中的静态常量不会触发该类初始化。这是因为在编译阶段通过常量传播优化,已经将常量的值存储到Example类的常量池中,以后Example类对SubClass类的常量引用实际都被转化为Example类对自身常量池的引用了。换句话说,这两个类在被编译成Class之后就不存在任何联系了。

类加载过程

一、加载

“加载”是类加载过程中的第一个阶段,在这个阶段,虚拟机会完成以下三件事情:

1. 通过一个类的全限定名称来获取定义此类的二进制字节流

这里说的是通过一个类的全限定名称来获取此类的二进制字节流,JVM规范并没有要求必须从一个Class文件中获取。
这就意味着,开发人员可以利用这个特点玩出各种花样,很多举足轻重的技术都建立在这个基础之上,例如:
1) 从ZIP包读取,例如jar、war包。
2) 从网络中获取,典型应用就是Applet(现在已经很少用到)。
3) 运行时计算生成,这种用的最多的就是动态代理。
4) 由其他文件生成,典型场景是JSP应用,即由JSP文件生成对应的Class类。
5) …

2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构

加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中。虚拟机规范未规定此区域的具体数据结构,可由虚拟机自行定义。

3. 创建Class对象

加载完成后,会在内存中实例化一个java.lang.Class对象,这个对象将作为程序访问方法区中的这些类型数据的外部接口。虚拟机规范并未要求此对象必须存储在Java堆中,就常见的HotSpot虚拟机而言,Class对象存储在方法区。

二、验证

验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。前面说过,这个字节流的来源可能有很多种,所以这一步的验证是非常必要的。

验证阶段大致上会完成下面四个阶段的检查动作:文件格式验证、元数据验证、字节码验证、符号引用验证。

三、准备

准备阶段是正式为类变量分配内存并设置类变量初始值阶段,这些变量所使用的内存都将在方法区中进行分配。注意区分类变量和实例变量,类变量指的是静态变量,实例变量的初始值是对象实例化时随着对象一起分配在堆内存中的。然后就是请注意,这里的初始值通常情况下指的是数据类型的零值,而不是用户定义的初始值。例如:

1
public static int i = 10;

准备阶段的设置初始值会将i设置为int类型的零值,也就是0,而不是10,将i赋值为10的过程是在初始化阶段(前文所说的类加载的第5阶段)执行的。

为什么说是通常情况呢?那是因为如果这个类变量是一个final修饰的常量,那么在准备阶段就会初始化为指定的值。编译时javac将会为这个常量生成ConstantValue属性,在准备阶段虚拟机就会根据ConstantValue的设置将变量值设置为指定的值。

四、解析

解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行。

五、初始化

类初始化阶段是类加载过程中的最后一步,前面的类加载过程中,除了在加载阶段用户应用程序可以通过自定义类加载器参与外,其余阶段完全由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的代码。

在准备阶段,变量已经初始化为系统要求的零值。而在初始化阶段,则是根据程序员的意愿来初始化类的资源。或者换个角度表达就是初始化阶段是执行类构造器< cinit>()方法的过程。我们先说一下< cinit>()方法执行过程中可能会影响程序运行行为的特点和细节,后面再说是如何生成这个方法的。

< cinit>()方法的特点与细节

  • < cinit>()方法是由编译期自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的,编译期收集的顺序由语句在源文件中出现的顺序所决定。静态语句块只能访问定义在其之前的变量,对于定义在它后面的变量,静态语句块只能对其进行赋值操作,但是不能访问。如下所示:

    1
    2
    3
    4
    5
    6
    7
    8
    9
    public class Test {
    static {
    // 可以对定义在静态代码块之后的变量进行赋值,编译通过
    j = 30;
    // 不可以访问定义在静态代码块之后的变量 // 这句编译报错:非法向前引用
    System.out.print(j);
    }
    static int j = 20;
    }
  • < cinit>()方法与类的构造函数(或者说实例构造器< init>()方法,这个方法在创建对象的时候用于初始化对象)不同,它不需要显式地调用父类构造器。虚拟机会保证在子类的< cinit>()方法执行之前,父类的该方法已经执行完毕。上文在类加载时机中也说过,当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。因此在虚拟机中第一个被执行< cinit>()方法的类肯定是java.lang.Object

  • 由于父类的< cinit>()方法先执行,也就意味着父类定义的静态语句要优先于子类的变量赋值操作。
  • < cinit>()不是必需的。如果一个类中没有静态语句块,也没有对类变量的复制操作,那么编译期可以不为这个类生成该方法。
  • 接口中不能使用静态语句块,但是仍然有变量初始化赋值操作,因此接口与类一样都会生成< cinit>()方法。但是与类不同的是,执行接口的< cinit>()方法不需要先完成父接口的< cinit>()方法。只有当父接口中定义的变量被使用时,父接口才会初始化。另外,接口的实现类在初始化时也一样不会执行接口的< cinit>()方法。
  • 虚拟机会保证一个类的< cinit>()方法在多线程环境中被正确的加锁、同步。如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的< cinit>()方法,其他线程都需要阻塞等待,知道活动线程执行< cinit>()方法完毕。如果在一个类的()方法中有耗时很长的操作,就可能造成多个线程阻塞,实际应用中这种阻塞往往是很隐蔽的。

原文作者:XinAnzzZ

原文链接:https://www.yuhangma.com/2019/jvm/2019-03-03-jvm-load-class/

发表日期:March 3rd 2019, 12:00:00 am

更新日期:February 2nd 2021, 4:44:20 pm

版权声明:(转载本站文章请注明作者和出处 心 安 – XinAnzzZ ,请勿用于任何商业用途)

CATALOG
  1. 1. 前言
  2. 2. 类加载的时机
    1. 2.1. 测试用例
  3. 3. 类加载过程
    1. 3.1. 一、加载
      1. 3.1.1. 1. 通过一个类的全限定名称来获取定义此类的二进制字节流
      2. 3.1.2. 2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
      3. 3.1.3. 3. 创建Class对象
    2. 3.2. 二、验证
    3. 3.3. 三、准备
    4. 3.4. 四、解析
    5. 3.5. 五、初始化
      1. 3.5.1. < cinit>()方法的特点与细节