JVM与操作系统的关系

1.JVM 基础

1.1 Java Virtual Machine是什么

​ JVM 全称 Java Virtual Machine,也就是我们耳熟能详的 Java 虚拟机。它能识别 .class后缀的文件,并且能够解析它的指令,最终调用操作系统上的函数,完成我们想要的操作。

1.2 JVM的作用是什么

​ JVM是一个抽象层,有了JVM,java代码就可以跨平台运行。JVM的作用主要是将字节码”翻译”成操作系统可以执行的指令代码。

JVM的作用.png

1.3 JVM、JRE、JDK的关系

JVM只是一个翻译,把Class翻译成机器识别的代码,但是需要注意,JVM 不会自己生成代码,需要大家编写代码,同时需要很多依赖类库,这个时候就需要用到JRE。

JRE是Java 运行环境(Java Runtime Environment),它除了包含JVM之外,提供了很多的类库(就是我们说的jar包,它可以提供一些即插即用的功能,比如读取或者操作文件,连接网络,使用I/O等等之类的)这些东西就是JRE提供的基础类库。JVM 标准加上实现的一大堆基础类库,就组成了 Java 的运行时环境。

​ 但对于程序员来说,JRE还不够。我写完要编译代码,还需要调试代码,还需要打包代码、有时候还需要反编译代码。所以我们会使用JDK,因为JDK还提供了一些非常好用的小工具,比如 javac(编译代码)、java、jar (打包代码)、javap(反编译<反汇编>)等。这个就是JDK

2. JVM的结构

2.1 整体结构

​ 一个 Java 程序,首先经过 javac 编译成 .class 文件,然后 JVM 将其加载到方法区,执行引擎将会执行这些字节码。执行时,会翻译成操作系统相关的函数。JVM 作为 .class 文件的翻译存在,输入字节码,调用操作系统函数。

​ 代码被处理的过程如下:Java 文件->编译器->字节码->JVM->机器码。

程序执行过程.png

2.2 JVM运行时数据区域

​ Java 引以为豪的就是它的自动内存管理机制。相比于 C++的手动内存管理、复杂难以理解的指针等,Java 程序写起来就方便的多。

​ 在 Java 中,JVM 内存主要分为堆、程序计数器、方法区、虚拟机栈和本地方法栈

运行时数据区组成.png

2.2.1 程序计数器

​ 较小的内存空间,当前线程执行的字节码的行号指示器;各线程之间独立存储,互不影响。

​ 程序计数器是一块很小的内存空间,主要用来记录各个线程执行的字节码的地址,例如:分支、循环、跳转、异常、线程恢复等都依赖于计数器。

​ 由于 Java 是多线程语言,当执行的线程数量超过 CPU 核数时,线程之间会根据时间片轮询争夺 CPU 资源。如果一个线程的时间片用完了,或者是其它原因导致这个线程的 CPU 资源被提前抢夺,那么这个退出的线程就需要单独的一个程序计数器,来记录下一条运行的指令。

​ 程序计数器也是JVM中唯一不会OOM(OutOfMemory)的内存区域

2.2.2 虚拟机栈

​ 虚拟机栈在JVM运行过程中存储当前线程运行方法所需的数据,指令、返回地址

​ Java 虚拟机栈是基于线程的。哪怕只有一个 main() 方法,也是以线程的方式运行的。在线程的生命周期中,参与计算的数据会频繁地入栈和出栈,栈的生命周期是和线程一样的。

​ 栈里的每条数据,就是栈帧。在每个 Java 方法被调用的时候,都会创建一个栈帧,并入栈。一旦完成相应的调用,则出栈。所有的栈帧都出栈后,线程也就结束了。

​ 每个栈帧,都包含四个区域:(局部变量表、操作数栈、动态链接、返回地址)

  • 局部变量表:用于存放我们的局部变量的。首先它是一个32位的长度,主要存放我们的Java的八大基础数据类型,一般32位就可以存放下,如果是64位的就使用高低位占用两个也可以存放下,如果是局部的一些对象,比如我们的Object对象,我们只需要存放它的一个引用地址即可,实体对象在堆中存放。
  • 操作数据栈:存放我们方法执行的操作数的,它就是一个栈,先进后出的栈结构,操作数栈,就是用来操作的,操作的的元素可以是任意的java数据类型,所以我们知道一个方法刚刚开始的时候,这个方法的操作数栈就是空的,操作数栈运行方法就是JVM一直运行入栈/出栈的操作。
  • 动态链接: Java语言特性多态(需要类运行时才能确定具体的方法)。
  • 返回地址: 正常返回(调用程序计数器中的地址作为返回)、异常的话(通过异常处理器表<非栈帧中的>来确定)

​ 栈的大小调节:缺省为1M,可用参数 –Xss调整大小,例如-Xss256k

2.2.3 本地方法栈

​ 本地方法栈跟 Java 虚拟机栈的功能类似,Java 虚拟机栈用于管理 Java 函数的调用,而本地方法栈则用于管理本地方法的调用。但本地方法并不是用 Java 实现的,而是由 C 语言实现的。

​ 本地方法栈是和虚拟机栈非常相似的一个区域,它服务的对象是 native 方法。你甚至可以认为虚拟机栈和本地方法栈是同一个区域。

​ 虚拟机规范无强制规定,各版本虚拟机自由实现 ,HotSpot直接把本地方法栈和虚拟机栈合二为一 。

2.2.4 方法区(永久代) (线程共享区)

​ 方法区主要是用来存放已被虚拟机加载的类相关信息,包括类信息、静态变量、常量、运行时常量池、字符串常量池。

​ JVM 在执行某个类的时候,必须先加载。在加载类(加载、验证、准备、解析、初始化)的时候,JVM 会先加载 class 文件,而在 class 文件中除了有类的版本、字段、方法和接口等描述信息外,还有一项信息是常量池 (Constant Pool Table),用于存放编译期间生成的各种字面量和符号引用。

​ 字面量包括字符串(String a=“b”)、基本类型的常量(final 修饰的变量),符号引用则包括类和方法的全限定名(例如 String 这个类,它的全限定名就是 Java/lang/String)、字段的名称和描述符以及方法的名称和描述符。

​ 而当类加载到内存中后,JVM 就会将 class 文件常量池中的内容存放到运行时的常量池中;在解析阶段,JVM 会把符号引用替换为直接引用(对象的索引值)。

元空间大小参数:

  • jdk1.7及以前(初始和最大值):-XX:PermSize;-XX:MaxPermSize;
  • jdk1.8以后(初始和最大值):-XX:MetaspaceSize; -XX:MaxMetaspaceSize
  • jdk1.8以后大小就只受本机总内存的限制(如果不设置参数的话)

Java8 为什么使用元空间替代永久代,这样做有什么好处呢?

​ 移除永久代是为了融合 HotSpot JVM 与 JRockit VM 而做出的努力,因为 JRockit 没有永久代,所以不需要配置永久代。

​ 永久代内存经常不够用或发生内存溢出,抛出异常 java.lang.OutOfMemoryError: PermGen。这是因为在 JDK1.7 版本中,指定的 PermGen 区大小为 8M,由于 PermGen 中类的元数据信息在每次 FullGC 的时候都可能被收集,回收率都偏低,成绩很难令人满意;还有,为 PermGen 分配多大的空间很难确定,PermSize 的大小依赖于很多因素,比如,JVM 加载的 class 总数、常量池的大小和方法的大小等。

2.2.5 堆区(线程共享区)

​ 堆是 JVM 上最大的内存区域,我们申请的几乎所有的对象,都是在这里存储的。我们常说的垃圾回收,操作的对象就是堆。
​ 堆空间一般是程序启动时,就申请了,但是并不一定会全部使用。
​ 随着对象的频繁创建,堆空间占用的越来越多,就需要不定期的对不再使用的对象进行回收。这个在 Java 中,就叫作 GC(Garbage Collection)。
​ 那一个对象创建的时候,到底是在堆上分配,还是在栈上分配呢?这和两个方面有关:对象的类型和在 Java 类中存在的位置。
​ Java 的对象可以分为基本数据类型和普通对象。
​ 对于普通对象来说,JVM 会首先在堆上创建对象,然后在其他地方使用的其实是它的引用。比如,把这个引用保存在虚拟机栈的局部变量表中。
​ 对于基本数据类型来说(byte、short、int、long、float、double、char),有两种情况。当你在方法体内声明了基本数据类型的对象,它就会在栈上直接分配。其他情况,都是在堆上分配

堆大小参数:

  • -Xms:堆的最小值;

  • -Xmx:堆的最大值;

  • -Xmn:新生代的大小;

  • -XX:NewSize;新生代最小值;

  • -XX:MaxNewSize:新生代最大值;

    例如- Xmx256m

2.3 直接内存

​ 不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域;如果使用了NIO,这块区域会被频繁使用,在java堆内可以用directByteBuffer对象直接引用并操作;

​ 这块内存不受java堆大小限制,但受本机总内存的限制,可以通过-XX:MaxDirectMemorySize来设置(默认与堆内存最大值一样),所以也会出现OOM异常。

3.深入理解运行时数据区

3.1 测试代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
public class Test {

public int calculate(){
int i = 1;
int j = 2;
int k = (i + j) * 10;
return k;
}

public static void main(String[] args) {
Test test = new Test();
test.calculate();
}
}

​ 使用javac工具编译Test.java类生成Test.class,并且使用javap工具反编译Test.class字节码可以看到calculate()方法字节码如下图:

calculate字节码.png

​ 从图中可以看到calculate()方法被反编结果包含两个部分: 一个是“行号”,用于程序计数器指引下一行机器需要执行的指令;另一个是字节码指令,用于虚拟机翻译成机器码执行的指令代码。

​ 因此,java代码执行是基于字节码指令;而C代码执行是基于寄存器。虽然基于寄存器的代码执行效率会高一点,但是可移植性会很差,不同平台不容易移植;而基于字节码指令的java代码,基于不同平台,只要虚拟机支持,java代码可以无缝移植。

3.2 运行时数据区执行过程

运行时数据区.png

对应的执行过程说明如下

0: iconst_1 -> 将int型 1 入操作数栈
1: istore_1 -> 将操作数栈栈顶int型值存入局部变量表(下标为1的位置)
2: iconst_2 -> 将int型 2 入操作数栈
3: istore_2 -> 将操作数栈栈顶int型值存入局部变量表(下标为2的位置)
4: iload_1 -> 将局部变量表中下标为1位置的值压入操作数栈
5: iload_2 -> 将局部变量表中下标为2位置的值压入操作数栈
6: iadd -> (1)将栈顶两个元素出栈 (2)执行相加 (3)将结果压入操作数栈
7: bipush 10 -> 将int型 10压入操作数栈
9: imul -> (1)将栈顶两个元素出栈 (2)执行相乘 (3)将结果压入操作数栈
10: istore_3 -> 将操作数栈顶int型数值压入局部变量表(下标为3的位置)
11: iload_3 -> 将局部变量表中下标为3位置的值压入操作数栈
12: ireturn -> 返回调用calculate方法的下一行地址继续执行

参考资料

JVM参数参考说明