聊聊并发——CAS算法

Posted 匠心

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了聊聊并发——CAS算法相关的知识,希望对你有一定的参考价值。

一、原子类

1、CAS算法

  强烈建议读者看这篇之前,先看这篇 初识JUC 的前两节,对原子性,原子变量,内存可见性有一个初步认识。

  CAS(Compare and Swap)是一种硬件对并发的支持,针对多处理器操作而设计的处理器中的一种特殊指令,用于管理对共享数据的并发访问,是硬件对于并发操作共享数据的支持。它是一个原子性的操作,对应到CPU指令为cmpxchg。它是一条CPU并发原语。
  CAS包含了3个操作数:内存值V,比较值A,更新值B。当且仅当V == A时,V = B,否则不执行任何操作。
  CAS算法:当多个线程并发的对主存中的数据进行修改的时候。有且只有一个线程会成功,其他的都会失败(同时操作,只是会失败而已,并不会被锁之类的)。
  CAS是一种无锁的非阻塞算法,是乐观锁的一种实现。不存在上下文切换的问题。
  CAS比普通同步锁效率高,原因:CAS算法当这一次不成功的时候,它下一次不会阻塞,也就是它不会放弃CPU的执行权,它可以立即再次尝试,再去更新。
  通俗的说:我要将变量 i 由 2 修改为 3。当内存中 i == 2,且修改成功,才为成功。若内存中 i 由于其他线程的操作已经不是 2 了,那此次我的修改视为失败。

2、简单使用

  JDK 1.5 以后java.util.concurrent.atomic包下提供了常用的原子变量。它支持单个变量上的无锁线程安全编程。这些原子变量具备以下特点:volatile的内存可见性;CAS算法保证数据的原子性。

  atomic包描述:图片来源API文档

  代码示例:原子变量使用

 public class Main {
     public static void main(String[] args) {
         AtomicInteger integer = new AtomicInteger(2);
 
         boolean b = integer.compareAndSet(3, 5);
         System.out.println(b);
         System.out.println(integer.get());
 
         b = integer.compareAndSet(2, 10);
         System.out.println(b);
         System.out.println(integer.get());
 
         // 等价于 i++
         integer.getAndIncrement();
 
         // 等价于 ++i
         integer.incrementAndGet();
     }
 }
 
 // 结果
 false
 2
 true
 10

  分析:很简单,设置初始值为 2。
  ①由 3 修改成5,而设置初始值内存值为2,所以修改失败,返回false。
  ②由 2 修改成10,初始值内存值为2,所以修改成功,返回true。

3、源码分析

  这些原子变量底层就是通过CAS算法来保证数据的原子性。
  源码示例:AtomicInteger 类

 public class AtomicInteger extends Number implements java.io.Serializable {
     private static final long serialVersionUID = 6214790243416807050L;
 
     // setup to use Unsafe.compareAndSwapInt for updates
     private static final Unsafe unsafe = Unsafe.getUnsafe();
     private static final long valueOffset;
 
     // 获取value在内存的地址偏移量
     static {
         try {
             valueOffset = unsafe.objectFieldOffset
                 (AtomicInteger.class.getDeclaredField("value"));
         } catch (Exception ex) { throw new Error(ex); }
     }
 
     private volatile int value;
 
     public AtomicInteger(int initialValue) {
         value = initialValue;
     }
 
     public AtomicInteger() {
     }
 
     public final int get() {
         return value;
     }
 
     public final void set(int newValue) {
         value = newValue;
     }
 
     public final boolean compareAndSet(int expect, int update) {
         return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
     }
 
     public final int getAndIncrement() {
         return unsafe.getAndAddInt(this, valueOffset, 1);
     }
 
     public final int incrementAndGet() {
         return unsafe.getAndAddInt(this, valueOffset, 1) + 1;
     }
 
 }

  说明:public final boolean compareAndSet(int expect, int update)
  变量valueOffset:通过静态代码块获取变量value在内存中的偏移地址。
  变量value:用volatile修饰,这里体现了"多线程之间的内存可见性"。
  this:即 AtomicInteger 对象本身。
  很容易理解:就是将当前对象 this 的变量value,由期望值 expect 修改为 update。

  源码示例:Unsafe 类

 public final class Unsafe {
 
     public native void throwException(Throwable var1);
 
     public final native boolean compareAndSwapObject(Object var1, long var2, Object var4, Object var5);
 
     public final native boolean compareAndSwapInt(Object var1, long var2, int var4, int var5);
 
     public final native boolean compareAndSwapLong(Object var1, long var2, long var4, long var6);
 
     public native int getIntVolatile(Object var1, long var2);
 
 
     public final int getAndAddInt(Object var1, long var2, int var4) {
         int var5;
         do {
             // 获取对象var1的变量var2的内存值
             var5 = this.getIntVolatile(var1, var2);
         } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4));
 
         return var5;
     }
 
 }

  Unsafe是CAS的核心类,其所有方法都是native修饰的。也就是说Unsafe类中的方法都直接调用操作系统底层资源执行相应任务,是由C/C++编写的本地方法。CAS算法的实现,也是由Unsafe类通过调用本地方法直接操作特定内存数据来实现的。
  getAndIncrement()方法能够在多线程环境保证变量的原子性自增。但源码中,并没有加synchronized或者lock锁,那么,它是如何保证的呢?其实很简单:

  先获取一次变量的内存值,然后通过CAS算法进行比较更新。失败了就一直不停的重试,是一个循环的过程,这个过程也称作自旋。
  这就是为什么 AtomicInteger 的自增操作具备原子性。

 private AtomicInteger i = new AtomicInteger();
 public int getI() {
     return i.getAndIncrement();
 }

4、CAS的缺点

  (1)ABA问题。
  (2)循环时间变长:高并发情况下,使用CAS可能会存在一些线程一直循环修改不成功,导致循环时间变长,这会给CPU带来很大的执行开销。由于AtomicInteger中的变量是volatile的,为了保证内存可见性,需要保证缓存一致性,通过总线传输数据,当有大量的CAS循环时,会产生总线风暴。
  (3)只能保证一个变量的原子操作:如果需要保证多个变量操作的原子性,是做不到的。对于这种情况只能使用synchronized或者juc包中的Lock工具。

二、ABA问题

1、介绍

  代码示例:演示ABA问题

 // 原子引用类演示ABA问题
 public class ABATest {
     public static void main(String[] args) throws InterruptedException {
         AtomicReference<String> reference = new AtomicReference<>("A");
 
         // 线程 t1 由A修改B,又由B修改A
         new Thread(() -> {
             System.out.println(reference.compareAndSet("A", "B") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
             System.out.println(reference.compareAndSet("B", "A") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
         }, "t1").start();
 
 
         new Thread(() -> {
             // 让t1线程完成ABA操作
             try {
                 Thread.sleep(500);
             } catch (InterruptedException e) {
                 e.printStackTrace();
             }
             System.out.println(reference.compareAndSet("A", "C") + ". " + Thread.currentThread().getName() + " value is:" + reference.get());
 
         }, "t2").start();
 
         Thread.sleep(1000);
 
         System.out.println(reference.get());
     }
 }
 
 // 结果
 true. t1 value is:B
 true. t1 value is:A
 true. t2 value is:C
 C

  如何理解ABA问题?
  可能你会觉得,线程 t2 不就是要将"A"改为"C"嘛,虽然中间变化了,但对 t2 也没影响呀!
  比如:你的银行卡里有10w,中间你领了工资1w,然后,又被扣除还了房贷1w,此时,你的银行卡里还是10w。虽然结果没变,但余额已经不是原来的余额了。而且,你一定在意中间你的钱去哪里了,所以是不一样的。
  再比如:对于公司财务来说,可能某一时刻,账户是100w,你偷偷挪用了公款20w,后来又悄悄补上了。虽然结果没变,但中间的记账明细,其实我们是关心的,因为这个时候你已经犯法了。

2、解决

  带时间戳的原子引用:Java提供了AtomicStampedReference来解决ABA问题。其实其实就是加了版本号,每一次的修改,版本号都 +1。比对的是 内存值 + 版本号 是否一致。
  代码示例:解决ABA问题

 public class ABATest {
     public static void main(String[] args) throws InterruptedException {
 
         AtomicStampedReference<String> reference = new AtomicStampedReference<>("A", 1);
         final int stamp = reference.getStamp();
 
         // 线程 t1 由A修改B,又由B修改A
         new Thread(() -> {
             System.out.println(reference.compareAndSet("A", "B", stamp, stamp + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
             System.out.println(reference.compareAndSet("B", "A", reference.getStamp(), reference.getStamp() + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
         }, "t1").start();
         
 
         new Thread(() -> {
             // 让t1线程完成ABA操作
             try {
                 Thread.sleep(500);
             } catch (InterruptedException e) {
                 e.printStackTrace();
             }
             System.out.println(reference.compareAndSet("A", "C", stamp, stamp + 1) + ". " + Thread.currentThread().getName() + " value is:" + reference.getReference());
 
         }, "t2").start();
 
         Thread.sleep(1000);
 
         System.out.println(reference.getReference());
     }
 }
 
 // 结果
 true. t1 value is:B
 true. t1 value is:A
 false. t2 value is:A    // t2并没有修改成功
 A

  compareAndSet()方法的 4 个参数:

  expectedReference:表示期望的引用值
  newReference:表示要修改后的新引用值
  expectedStamp:表示期望的戳(版本号)
  newStamp:表示修改后新的戳(版本号)

3、源码分析

 public class AtomicStampedReference<V> {
 
     private static class Pair<T> {
         final T reference;
         final int stamp;
         private Pair(T reference, int stamp) {
             this.reference = reference;
             this.stamp = stamp;
         }
         static <T> Pair<T> of(T reference, int stamp) {
             return new Pair<T>(reference, stamp);
         }
     }
     
     public boolean compareAndSet(V   expectedReference,
                                  V   newReference,
                                  int expectedStamp,
                                  int newStamp) {
         Pair<V> current = pair;
         return
             expectedReference == current.reference &&
             expectedStamp == current.stamp &&
             ((newReference == current.reference &&
               newStamp == current.stamp) ||
              casPair(current, Pair.of(newReference, newStamp)));
     }
 
     private boolean casPair(Pair<V> cmp, Pair<V> val) {
         return UNSAFE.compareAndSwapObject(this, pairOffset, cmp, val);
     }
 }

  很简单,维护了一对Pair,里面除了引用reference,还有一个int类型的戳(版本号)。比较更新的时候,两个变量都要比较。

三、LongAdder

1、介绍

  《阿里巴巴Java开发手册》推荐使用LongAdder。

  AtomicLong,本质上是多个线程同时操作同一个目标资源,有且只有一个线程执行成功,其他线程都会失败,不断重试(自旋),自旋会成为瓶颈。
  而LongAdder的思想就是把要操作的目标资源[分散]到数组Cell中,每个线程对自己的Cell变量的value进行原子操作,大大降低了失败的次数。
  这就是为什么在高并发场景下,推荐使用LongAdder的原因。

  参考文档:https://www.matools.com/api/java8
  《阿里巴巴Java开发手册》百度网盘:https://pan.baidu.com/s/1aWT3v7Efq6wU3GgHOqm-CA 密码: uxm8

作者:Craftsman-L

本博客所有文章仅用于学习、研究和交流目的,版权归作者所有,欢迎非商业性质转载。

如果本篇博客给您带来帮助,请作者喝杯咖啡吧!点击下面打赏,您的支持是我最大的动力!

以上是关于聊聊并发——CAS算法的主要内容,如果未能解决你的问题,请参考以下文章

CAS无锁策略

JUC并发编程07:单例模式CAS算法和原子引用

并发编程__模拟CAS算法

并发策略-CAS算法

markdown [Apereo CAS 3.5 CORE] Apereo CAS 3.5 #CAS的核心代码片段

Java并发编程之LongAdder和LongAccumulator源码探究