Java——聊聊JUC中的Java内存模型(JMM)

Posted 宋子浩

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java——聊聊JUC中的Java内存模型(JMM)相关的知识,希望对你有一定的参考价值。

文章目录:

1.CPU缓存模型

2.Java内存模型Java Memory Model

3.JMM规范下的三大特性

3.1 原子性

3.2 可见性

3.3 有序性

4.JMM规范下,多线程对变量的读写过程

5.JMM规范下,多线程先行发生原则之happens-before

5.1 8条规则

5.2 小案例


1.CPU缓存模型

我们先来看一下任务管理器性能这一块的东西。(那张图上传一直不成功,,,)

其实就是说一下计算机的存储结构体系,从本地磁盘到主存到CPU缓存,也就是从硬盘到内存,到CPU。

那么在这里为什么要在CPU和主内存之间又搞了个缓存呢?

类比我们开发网站后台系统使用的缓存(比如 Redis)是为了解决程序处理速度和访问常规关系型数据库速度不对等的问题。 CPU 缓存则是为了解决 CPU 处理速度和内存处理速度不对等的问题。我们甚至可以把 内存可以看作外存的高速缓存,程序运行的时候我们把外存的数据复制到内存,由于内存的处理速度远远高于外存,这样提高了处理速度。

总结:CPU Cache 缓存的是内存数据用于解决 CPU 处理速度和内存不匹配的问题,内存缓存的是硬盘数据用于解决硬盘访问速度过慢的问题。

因为有很多级的缓存,所以就会导致cpu和主内存的速度不一致的。当然这个执行速度是:CPU寄存器 > 高速缓存 > 主内存 > 硬盘。
而我们的CPU运行并不是直接操作内存,而是先把内存里边的数据读取并加载到缓存中,我们为了不断平衡CPU和主内存的计算速度,所以在其中增加了CPU一二三级缓存。


而由于CPU的速度是远远超过主物理内存的,所以就会在一定程度上导致内存的读和写操作不一致的问题。

CPU Cache 的工作方式: 先复制一份数据到 CPU Cache 中,当 CPU 需要用到的时候就可以直接从 CPU Cache 中读取数据,当运算完成后,再将运算得到的数据写回 Main Memory 中。但是,这样存在 内存缓存不一致性的问题 !比如我执行一个 i++ 操作的话,如果两个线程同时执行的话,假设两个线程从 CPU Cache 中读取的 i=1,两个线程做了 1++ 运算完之后再写回 Main Memory 之后 i=2,而正确结果应该是 i=3。

为了解决这个问题,就有了下面这张图:↓↓↓

这个缓存缓存一致性协议指的是在 CPU 高速缓存与主内存交互的时候需要准守的原则和规范。不同的 CPU 中,使用的缓存一致性协议通常也会有所不同。

Java虚拟机规范中试图定义一种Java内存模型(java Memory Model,简称JMM) 来屏蔽掉各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。


2.Java内存模型Java Memory Model

  1. 定义:JMM (Java内存模型Java Memory Model,简称JMM) 本身是一种抽象的概念并不真实存在,你可以把 JMM 看作是 Java 定义的并发编程相关的一组规范,抽象了线程和主内存之间的关系,其还规定了从 Java 源代码到 CPU 可执行指令的这个转化过程要遵守哪些和并发相关的原则和规范,其主要目的是为了简化多线程编程,增强程序可移植性的。
  2. 原则:JMM的关键技术点都是围绕多线程的原子性、可见性和有序性展开的。

3.JMM规范下的三大特性

3.1 原子性

一次操作或者多次操作,要么所有的操作全部都得到执行并且不会受到任何因素的干扰而中断,要么都不执行。

在 Java 中,可以借助synchronized 、各种 Lock 以及各种原子类实现原子性。synchronized 和各种 Lock 可以保证任一时刻只有一个线程访问该代码块,因此可以保障原子性。各种原子类是利用 CAS (compare and swap) 操作(可能也会用到 volatile或者final关键字)来保证原子操作。

3.2 可见性

指当一个线程修改了某一个共享变量的值,其他线程是否能够立即知道该变更 ,JMM规定了所有的变量都存储在主内存中。在 Java 中,可以借助synchronized 、volatile 以及各种 Lock 实现可见性。如果我们将变量声明为 volatile ,这就指示 JVM,这个变量是共享且不稳定的,每次使用它都到主存中进行读取。

什么是主内存?什么是本地内存?

  • 主内存 :所有线程创建的实例对象都存放在主内存中,不管该实例对象是成员变量还是方法中的本地变量(也称局部变量)
  • 本地内存 :每个线程都有一个私有的本地内存来存储共享变量的副本,并且,每个线程只能访问自己的本地内存,无法访问其他线程的本地内存。本地内存是 JMM 抽象出来的一个概念,存储了主内存中的共享变量副本。

在Java语言中,普通的共享变量不保证可见性,因为数据修改被写入内存的时机是不确定的,多线程并发下很可能出现"脏读",所以每个线程都有自己的工作内存,线程自己的工作内存中保存了该线程使用到的变量对应到主内存的副本拷贝,线程对变量的所有操作(读取,赋值等 )都必需在线程自己的工作内存中进行,而不能够直接读写主内存中的变量。不同线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。

如果没有保证可见性:导致-线程脏读,就比如下面的情况:↓↓↓

  1. 主内存中有变量 x,初始值为 0。
  2. 线程 A 要将 x 加 1,先将 x=0 拷贝到自己的私有内存中,然后更新 x 的值。
  3. 线程 A 将更新后的 x 值回刷到主内存的时间是不固定的。
  4. 刚好在线程 A 没有回刷 x 到主内存时,线程 B 同样从主内存中读取 x,此时为 0,和线程 A 一样的操作,最后期盼的 x=2 就会变成 x=1。

3.3 有序性

对于一个线程的执行代码而言,我们总是习惯性认为代码的执行总是从上到下,有序执行。但为了提供性能,编译器和处理器通常会对指令序列进行重新排序。Java规范规定JVM线程内部维持顺序化语义,即只要程序的最终结果与它顺序化执行的结果相等,那么指令的执行顺序可以与代码顺序不一致,此过程叫指令的重排序。在 Java 中,volatile 关键字可以禁止指令进行重排序优化。

JVM能根据处理器特性(CPU多级缓存系统、多核处理器等)适当的机器对指令进行重排序,使得机器指令能更符合CPU的执行特性,最大限度的发挥机器性能。但是,指令重排可以保证串行语义一致,但没有义务保证多线程间的语义也一致(即可能产生“脏读”),简单说,两行以上不相干的代码在执行的时候有可能先执行的不是第一条,不见得是从上到下顺序执行,执行顺序会被优化。

指令重排的三种表现(层面)

  • 编译器优化的重排

  • 指令并行的重排

  • 内存系统的重排

单线程环境里面确保程序最终执行结果和代码顺序执行的结果一致。处理器在进行重排序时必须要考虑指令之间的数据依赖性。

多线程环境中线程交替执行,由于编译器优化重排的存在,两个线程中使用的变量能否保证一致性是无法确定的,结果无法预测。


4.JMM规范下,多线程对变量的读写过程

由于JVM运行程序的实体是线程,而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间),工作内存是每个线程的私有数据区域,而Java内存模型中规定所有变量都存储在主内存,主内存是共享内存区域,所有线程都可以访问,但线程对变量的操作(读取赋值等)必须在工作内存中进行,首先要将变量从主内存拷贝到的线程自己的工作内存空间,然后对变量进行操作,操作完成后再将变量写回主内存,不能直接操作主内存中的变量,各个线程中的工作内存中存储着主内存中的变量副本拷贝,因此不同的线程间无法访问对方的工作内存,线程间的通信(传值)必须通过主内存来完成。

JMM定义了线程和主内存之间的抽象关系

  • 线程之间的共享变量存储在主内存中(从硬件角度来说就是内存条)
  • 每个线程都有一个私有的本地工作内存,本地工作内存中存储了该线程用来读/写共享变量的副本(从硬件角度来说就是CPU的缓存,比如寄存器、L1、L2、L3缓存等)

小总结

  • 我们定义的所有共享变量都存储在物理主内存中
  • 每个线程都有自己独立的工作内存,里面保存该线程使用到的变量的副本(主内存中该变量的一份拷贝)
  • 线程对共享变量所有的操作都必须先在线程自己的工作内存中进行后写回主内存,不能直接从主内存中读写(不能越级)
  • 不同线程之间也无法直接访问其他线程的工作内存中的变量,线程间变量值的传递需要通过主内存来进行(同级不能相互访问)

5.JMM规范下,多线程先行发生原则之happens-before

  1. 如果一个操作happens-before另一个操作,那么第一个操作的执行结果将对第二个操作可见,而且第一个操作的执行顺序排在第二个操作之前。
  2. 两个操作之间存在happens-before关系,并不一定要按照happens-before原则制定的顺序来执行。如果重排序之后的执行结果与按照happens-before关系来执行的结果一致,那么这种重排序并不非法。

happens-before先行发生原则:在JMM中,如果一个操作执行的结果需要对另一个操作可见性或者代码重新排序,那么这两个操作之间必须存在happens-before(先行发生)原则。逻辑上的先后关系。

x,y案例说明

  1. x=5; 线程A执行
  2. y=x; 线程B执行

问:y一定等于5吗?  答:不一定

如果线程A的操作(x= 5)happens-before(先行发生)线程B的操作(y = x),那么可以确定线程B执行后y = 5 一定成立;

如果他们不存在happens-before原则,那么y = 5 不一定成立。

为确保y一定等于5,就需要先行发生原则,也就是happens-before原则的威力。-------------------》包含可见性和有序性的约束

先行发生原则(happens-before)被定义在了JMM之中,如果Java内存模型中所有的有序性都仅靠volatile和synchronized来完成,那么有很多操作都将会变得非常啰嗦,但是我们在编写Java并发代码的时候并没有察觉到这一点。我们没有处处添加volatile和synchronized来完成程序,这是因为Java语言中JMM原则下有一个先行发生(Happens-Before)的原则限制和规矩,它是判断数据是否存在竞争,线程是否安全的非常有用的手段。依赖这个原则,我们可以通过几条简单规则一揽子解决并发环境下两个操作之间是否可能存在冲突的所有问题,而不需要陷入Java内存模型苦涩难懂的底层编译原理之中。

5.1 8条规则

  1. 次序规则:一个线程内,按照代码顺序,写在前面的操作先行发生于写在后面的操作。

  2. 锁定规则:锁的获取的先后顺序:一个unLock操作先行发生于后面(这里的后面是指时间上的先后)对同一个锁的lock操作(一个线程想要lock,肯定要等前面的锁unLock释放这个资源)。

  3. volatile变量规则:对一个volatile变量的读写操作先行发生于后面对这个变量的读操作,前面的写对后面的读是可见的,这里的后面同样是指时间上的先后。

  4. 传递规则:如果操作A先行发生于操作B,而操作B又先行发生于操作C,则可以得出操作A先行发生于操作C。

  5. 线程启动规则(Thread Start Rule):Thread对象的start()方法先行发生于此线程的每一个动作。

  6. 线程中断规则(Thread Interruption Rule):对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断事件的发生;可以通过Thread.interrupted()检测到是否发生中断。也就是说你要先调用了interrupt()方法设置过中断标志位,我才能检测到中断发送。

  7. 线程终止规则(Thread Termination Rule):线程中的所有操作都先行发生于对此线程的终止检测,我们可以通过isAlive()等手段检测线程是否已经终止执行。

  8. 对象终结规则(Finalizer Rule):一个对象的初始化完成(构造函数执行结束)先行发生于它的finalize()方法的开始,finalize的通常目的是在对象被不可撤销的丢弃之前执行清理操作。

5.2 小案例

public class TestDemo 
    private int value = 0;

    public int getValue() 
        return value; 
    

    public int setValue() 
        return ++value;
    

  • 问:假设存在线程A和B,线程A先(时间上的先后)调用了setValue(),然后线程B调用了同一个对象的getValue(),那么线程B收到的返回值是什么?是0还是1?

  • 答:真不一定

    我们就这段简单的代码一次分析happens-before的规则(规则5、6、7、8 可以忽略,因为他们和这段代码毫无关系):
    1  由于两个方法是由不同的线程调用,不在同一个线程中,所以肯定不满足程序次序规则;
    2  两个方法都没有使用锁,所以不满足锁定规则;
    3  变量不是用volatile修饰的,所以volatile变量规则不满足;
    4  传递规则肯定不满足;

    所以我们无法通过happens-before原则推导出线程A happens-before线程B,虽然可以确认在时间上线程A优先于线程B指定,但就是无法确认线程B获得的结果是什么,所以这段代码不是线程安全的。那么怎么修复这段代码呢?

  • 修复如下:↓↓↓

/**
 * synchronized太猛了,降低太多的效率
 */
public class TestDemo 
    private int value = 0;

    public synchronized int getValue() 
        return value; 
    

    public synchronized int setValue() 
        return ++value;
    

/**
 * 利用volatile保证读取操作的可见性;利用synchronized保证复合操作的原子性结合使用锁和volatile变量来减少同步的开销。
 */
public class TestDemo 
    private volatile int value = 0;

    public int getValue() 
        return value; 
    

    public synchronized int setValue() 
        return ++value;
    

以上是关于Java——聊聊JUC中的Java内存模型(JMM)的主要内容,如果未能解决你的问题,请参考以下文章

Java——聊聊JUC中的Java内存模型(JMM)

Java——聊聊JUC中的Java内存模型(JMM)

JUC多线程:JMM内存模型与volatile内存语义

Juc11_Java内存模型之JMM八大原子操作三大特性读写过程happens-before

Juc11_Java内存模型之JMM八大原子操作三大特性读写过程happens-before

JUC - 多线程之JMM;volatile