首页 > 技术文章 > JVM内存分配机制

gdvxfgv 2022-03-14 22:43 原文

对象的创建流程:

image

1.类加载检查:虚拟机遇到一条new指令时,会去检查这个指令的参数能否在常量池中找到一个类的符号引用,并且检查这个符号引用指向的类是否被加载、解析和初始化过。如果没有,则会执行类加载过程。
(new指令指的是new关键词、对象克隆、对象序列化等)
2.分配内存
在类加载检查通过后,虚拟机会为新生的对象分配内存。对象需要的内存大小在类加载完成后可以完全确定,此时其实是从Java堆中划分一块指定的内存空间。
3.初始化
内存分配完毕后,虚拟机将分配到的内存空间都初始化零值(不包括对象头),如果使用了TLAB,这个过程可以提前到TLAB分配时进行。
4.设置对象头
初始化之后,虚拟机会将类的一些信息设置到对象头中。如对象是哪个类的实例,如何找到类的元数据信息,对象的哈希码,对象的gc分代年龄等等。
在HotSpot中,对象在内存中的结构可以分为3块:对象头,实例数据和对齐填充。
5.执行方法
即按照程序员的意愿赋初始值,如属性赋值,执行构造方法。

如何划分内存?

划分内存有两种方法:
1.指针碰撞(默认):如果堆中的内存是工整的,即用过的内存在一边,空闲的内存在另一边,中间放着一个指针做分界点的指示器,那么此时分配内存就是将指针向空闲部分移动指定距离。
2.空闲列表:如果堆中的内存不是工整的,已使用的内存和空闲内存交错分布,这个时候没办法使用指针碰撞了,虚拟机就必须维护一个列表,记录哪些内存块可以使用,在分配的时候从列表中找一块足够大的空间划分给对象实例,并更新列表的记录。

内存划分的并发问题如何解决?

1.通过CAS加上失败重试机制来保证对分配内存空间的动作进行同步处理
2.本地线程分配缓冲:把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在Java堆中都预先分配一小块内存。通过-XX:+/-UseTLAB来设置是否使用此功能(JVM默认开启),-XX:TLABSize可以指定TLAB分配的空间大小

为什么要有填充字段?

操作系统查找时候是按照8的整数倍去查找的,如果没有填充字段,对象在堆中的位置可能不是8的整数倍,这样操作系统进行查找的时候需要花费多余的时间去进行计算位置操作。因此需要填充字段将8位补齐。

什么是指针压缩?

1.jdk1.6开始,64位操作系统支持指针压缩
2.jvm配置参数:UseCompressedOops,compressed­­压缩、oop(ordinary object pointer)­­对象指针
3.启用指针压缩:­XX:+UseCompressedOops(默认开启),禁止指针压缩:­XX:­UseCompressedOops
4.指针压缩其实是通过一系列的算法,将超过32位的指针变成32位的指针去存储,在使用时再解密回来(如35位变成32位存储,使用时继续按照35来使用)

为什么要进行指针压缩?

1.在64位平台的HotSpot中使用32位指针,内存使用会多出1.5倍左右,使用较大指针在主内存和缓存之间移动数据,占用较大宽带,同时GC也会承受较大压力
2.为了减少64位平台下内存的消耗,启用指针压缩功能
3.在jvm中,32位地址最大支持4G内存(2的32次方),可以通过对对象指针的压缩编码、解码方式进行优化,使得jvm 只用32位地址就可以支持更大的内存配置(小于等于32G)
4.堆内存小于4G时,不需要启用指针压缩,jvm会直接去除高32位地址,即使用低虚拟地址空间 5.堆内存大于32G时,压缩指针会失效,会强制使用64位(即8字节)来对java对象寻址,这就会出现1的问题,所以堆内存不要大于32G为好
6.不适用指针压缩,对象的大小会大许多,这样堆的空间容易产生压力,容易出现gc

对象内存分配流程:

image

为什么对象要分配在栈上?

一般来说对象都是在堆上分配的,需要依靠GC来进行内存回收。如果对象的数量很多,会给GC带来压力,从而影响程序的性能。为了减少对象在堆上分配的数量,因此对于方法中存在的临时变量(即不会脱离方法,仅在方法内部生效),JVM会通过逃逸分析来确定该对象不会在方法外部访问(即不会逃逸)。对于不会逃逸的对象,将它分配在栈中,这样对象所占用的空间会随着栈的出栈而销毁,从而降低GC压力。

对象是如何在栈上分配的?

JVM通过逃逸分析确定该对象不会被外部访问。
对象逃逸分析:就是分析对象动态作用域,当一个对象在方法中被定义后,它可能被外部方法所引用,例如作为调用参数传递到其他地方中。
JVM可以通过开启逃逸分析参数(-XX:+DoEscapeAnalysis)来优化对象内存分配位置,使其通过标量替换优先分配在栈上(栈上分配),JDK7之后默认开启逃逸分析,如果要关闭使用参数(-XX:-DoEscapeAnalysis)。

栈中的内存空间比较小,如果临时对象大小巨大,如何存放在栈中呢?

这个时候会通过标量替换来将一个对象拆分出来放在多个栈中。
标量替换:通过逃逸分析确定该对象不会被外部访问,并且对象可以被进一步分解时,JVM不会创建该对象,而是将该对象成员变量分解若干个被这个方法使用的成员变量所代替,这些代替的成员变量在栈帧或寄存器上分配空间,这样就不会因为没有一大块连续空间导致对象内存不够分配。开启标量替换参数(-XX:+EliminateAllocations),JDK7之后默认开启。
标量与聚合量:标量即不可被进一步分解的量,而JAVA的基本数据类型就是标量(如:int,long等基本数据类型以及reference类型等),标量的对立就是可以被进一步分解的量,而这种量称之为聚合量。而在JAVA中对象就是可以被进一步分解的聚合量。
注意:JVM中必须将逃逸分析参数开启,标量替换才有效果。同理标量替换也必须打开,逃逸分析才有意义。

对象在在Eden区分配

大多数情况下,对象在新生代中 Eden 区分配。当 Eden 区没有足够空间进行分配时,虚拟机将发起一次Minor GC。
大量的对象被分配在eden区,eden区满了后会触发minor gc,可能会有99%以上的对象成为垃圾被回收掉,剩余存活的对象会被挪到为空的那块survivor区,下一次eden区满了后又会触发minor gc,把eden区和survivor区垃圾对象回收,把剩余存活的对象一次性挪动到另外一块为空的survivor区,因为新生代的对象都是朝生夕死的,存活时间很短,所以JVM默认的8:1:1的比例是很合适的,让eden区尽量的大,survivor区够用即可。

Minor GC与Full GC

Minor GC/Young GC:指发生新生代的的垃圾收集动作,Minor GC非常频繁,回收速度一般也比较快。
Major GC/Full GC:一般会回收老年代 ,年轻代,方法区的垃圾,Major GC的速度一般会比Minor GC的慢10倍以上。
因此JVM调优的准则是尽量减少Full GC的次数,这也是为什么要让eden区尽量的大的原因

大对象直接进入老年代

大对象就是需要大量连续内存空间的对象(比如:字符串、数组)。JVM参数 -XX:PretenureSizeThreshold 可以设置大对象的大小,如果对象超过设置大小会直接进入老年代,不会进入年轻代,这个参数只在 Serial 和ParNew两个收集器下有效。
比如设置JVM参数:-XX:PretenureSizeThreshold=1000000 (单位是字节) -XX:+UseSerialGC ,我创建一个new byte[60000*1024];大小的对象,会发现直接进入了老年代。
这样的目的是避免在eden区和survivor区发生大量的内存复制。同样的,如果一次Minor GC后存活的对象s区放不下,也会直接进入老年代(空间分配担保机制)。

长期存活的对象将进入老年代

既然虚拟机采用了分代收集的思想来管理内存,那么内存回收时就必须能识别哪些对象应放在新生代,哪些对象应放在老年代中。为了做到这一点,虚拟机给每个对象一个对象年龄(Age)计数器。
如果对象在 Eden 出生并经过第一次 Minor GC 后仍然能够存活,并且能被 Survivor 容纳的话,将被移动到 Survivor空间中,并将对象年龄设为1。对象在 Survivor 中每熬过一次 MinorGC,年龄就增加1岁,当它的年龄增加到一定程度(默认为15岁,CMS收集器默认6岁,不同的垃圾收集器会略微有点不同),就会被晋升到老年代中。对象晋升到老年代的年龄阈值,可以通过参数 -XX:MaxTenuringThreshold 来设置。

对象动态年龄判断

当前放对象的Survivor区域里(其中一块区域,放对象的那块s区),一批对象的总大小大于这块Survivor区域内存大小的50%(-XX:TargetSurvivorRatio可以指定),那么此时大于等于这批对象年龄最大值的对象,就可以直接进入老年代了,
例如Survivor区域里现在有一批对象,年龄1+年龄2+年龄n的多个年龄对象总和超过了Survivor区域的50%,此时就会把年龄n(含)以上的对象都放入老年代。这个规则其实是希望那些可能是长期存活的对象,尽早进入老年代。对象动态年龄判断机制一般是在minor gc之后触发的。

老年代空间分配担保机制

年轻代每次minor gc之前JVM都会计算下老年代剩余可用空间
如果这个可用空间小于年轻代里现有的所有对象大小之和(包括垃圾对象)就会看一个“-XX:-HandlePromotionFailure”(jdk1.8默认就设置了)的参数是否设置了。
如果有这个参数,就会看看老年代的可用内存大小,是否大于之前每一次minor gc后进入老年代的对象的平均大小。
如果上一步结果是小于或者之前说的参数没有设置,那么就会触发一次Full gc,对老年代和年轻代一起回收一次垃圾,如果回收完还是没有足够空间存放新的对象就会发生"OOM"
当然,如果minor gc之后剩余存活的需要挪动到老年代的对象大小还是大于老年代可用空间,那么也会触发full gc,full gc完之后如果还是没有空间放minor gc之后的存活对象,则也会发生“OOM
image

对象内存回收的方法

引用计数法

给对象中添加一个引用计数器,每当有一个地方引用它,计数器就加1;当引用失效,计数器就减1;任何时候计数器为0的对象就是不可能再被使用的。

可达性分析算法

将“GC Roots” 对象作为起点,从这些节点开始向下搜索引用的对象,找到的对象都标记为非垃圾对象,其余未标记的对象都是垃圾对象

常见引用类型

java的引用类型一般分为四种:强引用、软引用、弱引用、虚引用
强引用:普通的变量引用
public static User user = new User();
软引用:将对象用SoftReference软引用类型的对象包裹,正常情况不会被回收,但是GC做完后发现释放不出空间存放
新的对象,则会把这些软引用的对象回收掉。软引用可用来实现内存敏感的高速缓存。
public static SoftReference user = new SoftReference(new User());
软引用在实际中有重要的应用,例如浏览器的后退按钮。按后退时,这个后退时显示的网页内容是重新进行请求还是从
缓存中取出呢?这就要看具体的实现策略了。
(1)如果一个网页在浏览结束时就进行内容的回收,则按后退查看前面浏览过的页面时,需要重新构建
(2)如果将浏览过的网页存储到内存中会造成内存的大量浪费,甚至会造成内存溢出
弱引用:将对象用WeakReference软引用类型的对象包裹,弱引用跟没引用差不多,GC会直接回收掉,很少用
public static WeakReference user = new WeakReference(new User());
虚引用:虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系,几乎不用

推荐阅读