《Java并发编程的艺术》读后笔记-part2

Posted 2021-09-01 LL.LEBRON

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了《Java并发编程的艺术》读后笔记-part2相关的知识，希望对你有一定的参考价值。

文章目录

《Java并发编程的艺术》读后笔记-part2
- 第二章 Java并发机制的底层实现原理

《Java并发编程的艺术》读后笔记-part2

第二章 Java并发机制的底层实现原理

Java代码在编译后会变成Java字节码，字节码被类加载器加载到JVM里，JVM执行字节码，最终需要转化为汇编指令在CPU上执行，Java中所使用并发机制依赖于JVM的实现和CPU的指令。

1.volatile的应用

在多线程并发编程中synchronized和volatile都扮演着重要角色。与synchronized不同的是，volatile是轻量级的synchronized，它在多处理器开发中保证了共享变量的“可见性”。

可见性：当一个线程修改一个共享变量时，另外一个线程能读到这个修改的值。如果volatile变量修饰符使用恰当的话，它比synchronized的使用和执行成本更低，因为它不会引起线程上下文的切换和调度。

1.1volatile的定义与实现原理

在我们了解实现原理之前先了解一下CPU的术语，便于后续理解。话不多说，直接上图：

volatile是如何来保证可见性的呢？

我们这里用汇编指令来具体解析有volatile和无volatile的区别。

Java代码：

instance = new Singleton(); // instance是volatile变量

转变成的汇编代码，如下：

0x01a3de1d: movb $0×0,0×1104800(%esi);
0x01a3de24: lock addl $0×0,(%esp);

有volatile变量修饰的共享变量进行写操作的时候会多出第二行汇编代码，通过查IA-32架构软件开发者手册可知，Lock前缀的指令在多核处理器下会引发了两件事情：

将当前处理器缓存行的数据写回到系统内存。
这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。
- MESI（缓存⼀致性协议）：当CPU写数据时，如果发现操作的变量是共享变量，即在其他CPU中也存在该变量的副本，会发出信号通知其他CPU将该变量的缓存行置为无效状态，因此当其他CPU需要读取这个变量时，发现自己缓存中缓存该变量的缓存行是无效的，那么它就会从内存重新读取
- 嗅探：每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了，当处理器发现自己缓存行对应的内存地址被修改，就会将当前处理器的缓存行设置成无效状态，当处理器对这个数据进行修改操作的时候，会重新从系统内存中把数据读到处理器缓存里。

2.synchronized的实现原理和应用

我们先来看看synchronized的三种表现形式：

对于普通同步方法，锁是当前实例对象。
```
public synchronized void xpp() {
    
}
```

对于静态同步方法，锁是当期类的Class对象。

public void xpp() {
    synchronized (demo1Main1.class) ;
}

对于同步方法块，锁是synchronized括号里配置的对象。

public void xpp3() {
    synchronized (new test()) {
        
    }
}

2.1Java对象头

synchronized用的锁是存在Java对象头里的。

Java对象头里的Mark Word里默认存储对象的HashCode、分代年龄和锁标记位。如图（这里是32位的虚拟机）：

在运行期间，Mark Word里存储的数据会随着锁标志位的变化而变化。Mark Word可能变化为存储以下4种数据：

2.2锁的升级与对比

锁一共有四种状态，级别从低到高为：无锁状态，偏向锁状态，轻量级锁状态和重量级锁状态。

需要注意的是，这几个状态会随着竞争情况逐渐升级。锁可以升级但不能降级。这种锁升级却不能降级的策略，目的是为了提高获得锁和释放锁的效率。

偏向锁

大多数情况下，锁不仅不存在多线程竞争，而且总是由同一线程多次获得，为了让线程获得锁的代价更低而引入了偏向锁。

偏向锁使用了一种等到竞争出现才释放锁的机制，所以当其他线程尝试竞争偏向锁时，持有偏向锁的线程才会释放锁。
轻量级锁

当锁是偏向锁的时候，被其他线程访问，偏向锁就会升级为轻量级锁，其他线程会通过自旋的形式尝试获取锁，但不会阻塞，且性能会高点!
重量级锁

当锁为轻量级锁的时候，其他线程虽然是自旋，但自旋不会一直循环下去，当自旋一定次数的时候且还没有获取到锁，就会进入阻塞，该锁升级为重量级锁，重量级锁会让其他申请的线程进入阻塞，性能也会降低!

三种锁的优缺点对比：

3.原子操作的实现原理

原子操作：不可被中断的一个或一系列操作。

3.1处理器如何实现原子操作

使用总线锁保证原子性

我们先举一个经典的例子：i++，经典的读改写操作。

当有多个处理器同时对共享变量进行读改写操作，那么共享变量就会被多个处理器同时进行操作，这样读改写操作就不是原子的，操作完之后的共享变量会和期望的不一样。

如上图的例子，我们期望得到最后结果为3，但是结果可能为2。想要保证读改写共享变量的操作是原子的，就必须保证CPU1读改写共享变量的时候，CPU2不能操作缓存了该共享变量内存地址的缓存。

因此总线锁就是使用处理器提供的一个LOCK#信号，当一个处理器在总线上输出此信号时，其他处理器的请求将被阻塞住，那么该处理器可以独占共享内存。
使用缓存锁保证原子性

既然有了总线锁为何我们还需要缓存锁呢？

原因是，在同一时刻，我们只需保证对某个内存地址的操作是原子性即可，但总线锁却把CPU和整个内存之间的通信锁住了，这使得其他处理器不能操作其他内存地址的数据。所以总线锁的开销比较大。缓存锁在某些场合正好可以解决这一问题。

频繁使用的内存会缓存在处理器的L1、L2和L3高速缓存里，那么原子操作就可以直接在处理器内部缓存中进行，并不需要声明总线锁。

以下两种情况处理器不会使用缓存锁锁定：
1. 当操作的数据不能被缓存在处理器内部，或操作的数据跨多个缓存行（cache line）时，则处理器会调用总线锁定。
2. 有些处理器不支持缓存锁定。对于Intel 486和Pentium处理器，就算锁定的内存区域在处理器的缓存行中也会调用总线锁定。

3.2Java如何实现原子操作

在Java中可以通过锁和循环CAS的方式来实现原子操作。

使用循环CAS实现原子操作

JVM中的CAS操作正是利用了处理器提供的CMPXCHG指令实现的。自旋CAS实现的基本思路就是循环进行CAS操作直到成功为止。

当然CAS实现原子操作有三大问题：
1. ABA问题
  
  因为CAS需要在操作值的时候，检查值有没有发生变化，如果没有发生变化则更新，但是如果一个值原来是A，变成了B，又变成了A，那么使用CAS进行检查时会发现它的值没有发生变化，但是实际上却变化了。ABA问题的解决思路就是使用版本号。在变量前面追加上版本号，每次变量更新的时候把版本号加1，那么A→B→A就会变成1A→2B→3A。
  
  从 Java 1.5开始，JDK的Atomic包里提供了一个类AtomicStampedReference来解决ABA问题。这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用，并且检查当前标志是否等于预期标志，如果全部相等，则以原子方式将该引用和该标志的值设置为给定的更新值。
2. 循环时间长开销大
  
  自旋CAS如果长时间不成功，会给CPU带来非常大的执行开销。如果JVM能支持处理器提供的pause指令，那么效率会有一定的提升。
  
  pause指令有两个作用：第一，它可以延迟流水线执行指令（de-pipeline），使CPU不会消耗过多的执行资源，延迟的时间取决于具体实现的版本，在一些处理器上延迟时间是零；第二，它可以避免在退出循环的时候因内存顺序冲突（Memory Order Violation）而引起CPU流水线被清空（CPU Pipeline Flush），从而提高CPU的执行效率。
3. 只能保证一个共享变量的原子操作
  
  当对一个共享变量执行操作时，我们可以使用循环CAS的方式来保证原子操作，但是对多个共享变量操作时，循环CAS就无法保证操作的原子性，这个时候就可以用锁。还有一个取巧的办法，就是把多个共享变量合并成一个共享变量来操作。比如，有两个共享变量i＝2，j=a，合并一下ij=2a，然后用CAS来操作ij。
  
  从Java 1.5开始，JDK提供了AtomicReference类来保证引用对象之间的原子性，就可以把多个变量放在一个对象里来进行CAS操作。
使用锁实现原子操作

锁机制保证了只有获得锁的线程才能够操作锁定的内存区域。

JVM内部实现了很多种锁机制，有偏向锁、轻量级锁和互斥锁。有意思的是除了偏向锁，JVM实现锁的方式都用了循环CAS，即当一个线程想进入同步块的时候使用循环CAS的方式来获取锁，当它退出同步块的时候使用循环CAS释放锁。

以上是关于《Java并发编程的艺术》读后笔记-part2的主要内容，如果未能解决你的问题，请参考以下文章