第十章 乐观锁和悲观锁

    悲观锁:

    悲观锁就是我们常说的锁。对于悲观锁来说,它总是认为每次访问共享资源时会发生冲突,所以必须对每次数据操作加上锁,以保证临界区的程序同一时间只能有一个线程在执行。

    乐观锁:

    乐观锁又称为“无锁”,顾名思义,它是乐观派。乐观锁总是假设对共享资源的访问没有冲突,线程可以不停地执行,无需加锁也无需等待。而一旦多个线程发生冲突,乐观锁通常是使用一种称为CAS的技术来保证线程执行的安全性。

    由于无锁操作中没有锁的存在,因此不可能出现死锁的情况,也就是说乐观锁天生免疫死锁

    乐观锁多用于“读多写少“的环境,避免频繁加锁影响性能;而悲观锁多用于”写多读少“的环境,避免频繁失败和重试影响性能。

    CAS的全称是:比较并交换(Compare And Swap)。在CAS中,有这样三个值:

    • V:要更新的变量(var)
    • E:预期值(expected)
    • N:新值(new)

    比较并交换的过程如下:

    判断V是否等于E,如果等于,将V的值设置为N;如果不等,说明已经有其它线程更新了V,则当前线程放弃更新,什么都不做。

    所以这里的预期值E本质上指的是“旧值”

    我们以一个简单的例子来解释这个过程:

    1. 如果有一个多个线程共享的变量原本等于5,我现在在线程A中,想把它设置为新的值6;
    2. 我们使用CAS来做这个事情;
    3. 如果不等于5,说明i被其它线程改过了(比如现在i的值为2),那么我就什么也不做,此次CAS失败,i的值仍然为2。

    在这个例子中,i就是V,5就是E,6就是N。

    那有没有可能我在判断了i为5之后,正准备更新它的新值的时候,被其它线程更改了i的值呢?

    不会的。因为CAS是一种原子操作,它是一种系统原语,是一条CPU的原子指令,从CPU层面保证它的原子性

    当多个线程同时使用CAS操作一个变量时,只有一个会胜出,并成功更新,其余均会失败,但失败的线程并不会被挂起,仅是被告知失败,并且允许再次尝试,当然也允许失败的线程放弃操作。

    前面提到,CAS是一种原子操作。那么Java是怎样来使用CAS的呢?我们知道,在Java中,如果一个方法是native的,那Java就不负责具体实现它,而是交给底层的JVM使用c或者c++去实现。

    当然,他们都是public native的。

    Unsafe中对CAS的实现是C++写的,它的具体实现和操作系统、CPU都有关系。

    Linux的X86下主要是通过cmpxchgl这个指令在CPU级完成CAS操作的,但在多处理器情况下必须使用lock指令加锁来完成。当然不同的操作系统和处理器的实现会有所不同,大家可以自行了解。

    当然,Unsafe类里面还有其它方法用于不同的用途。比如支持线程挂起和恢复的parkunpark, LockSupport类底层就是调用了这两个方法。还有支持反射操作的allocateInstance()方法。

    上面介绍了Unsafe类的几个支持CAS的方法。那Java具体是如何使用这几个方法来实现原子操作的呢?

    JDK提供了一些用于原子操作的类,在java.util.concurrent.atomic包下面。在JDK 11中,有如下17个类:

    从名字就可以看得出来这些类大概的用途:

    • 原子更新基本类型
    • 原子更新数组
    • 原子更新引用
    • 原子更新字段(属性)

    这里我们以AtomicInteger类的getAndAdd(int delta)方法为例,来看看Java是如何实现原子操作的。

    先看看这个方法的源码:

    1. public final int getAndAdd(int delta) {
    2. }

    这里的U其实就是一个Unsafe对象:

    所以其实AtomicInteger类的getAndAdd(int delta)方法是调用Unsafe类的方法来实现的:

    1. @HotSpotIntrinsicCandidate
    2. public final int getAndAddInt(Object o, long offset, int delta) {
    3. int v;
    4. do {
    5. v = getIntVolatile(o, offset);
    6. } while (!weakCompareAndSetInt(o, offset, v, v + delta));
    7. }

    我们来一步步解析这段源码。首先,对象othis,也就是一个AtomicInteger对象。然后offset是一个常量VALUE。这个常量是在AtomicInteger类中声明的:

    同样是调用的的方法。从方法名字上来看,是得到了一个对象字段偏移量。

    继续看源码。前面我们讲到,CAS是“无锁”的基础,它允许更新失败。所以经常会与while循环搭配,在失败后不断去重试。

    这里声明了一个v,也就是要返回的值。从getAndAddInt来看,它返回的应该是原来的值,而新的值的v + delta

    这里使用的是do-while循环。这种循环不多见,它的目的是保证循环体内的语句至少会被执行一遍。这样才能保证return 的值v是我们期望的值。

    循环体的条件是一个CAS方法:

    1. public final boolean weakCompareAndSetInt(Object o, long offset,
    2. int expected,
    3. int x) {
    4. return compareAndSetInt(o, offset, expected, x);
    5. }
    6. public final native boolean compareAndSetInt(Object o, long offset,
    7. int expected,
    8. int x);

    可以看到,最终其实是调用的我们之前说到了CAS native方法。那为什么要经过一层weakCompareAndSetInt呢?从JDK源码上看不出来什么。在JDK 8及之前的版本,这两个方法是一样的。

    根据本文第一篇参考文章(文末链接),它跟volitile有关。

    简单来说,weakCompareAndSet操作仅保留了volatile自身变量的特性,而出去了happens-before规则带来的内存语义。也就是说,weakCompareAndSet无法保证处理操作目标的volatile变量外的其他变量的执行顺序( 编译器和处理器为了优化程序性能而对指令序列进行重新排序 ),同时也无法保证这些变量的可见性。这在一定程度上可以提高性能。

    再回到循环条件上来,可以看到它是在不断尝试去用CAS更新。如果更新失败,就继续重试。那为什么要把获取“旧值”v的操作放到循环体内呢?其实这也很好理解。前面我们说了,CAS如果旧值V不等于预期值E,它就会更新失败。说明旧的值发生了变化。那我们当然需要返回的是被其他线程改变之后的旧值了,因此放在了do循环体内。

    这里介绍一下CAS实现原子操作的三大问题及其解决方案。

    所谓ABA问题,就是一个值原来是A,变成了B,又变回了A。这个时候使用CAS是检查不出变化的,但实际上却被更新了两次。

    ABA问题的解决思路是在变量前面追加上版本号或者时间戳。从JDK 1.5开始,JDK的atomic包里提供了一个类AtomicStampedReference类来解决ABA问题。

    这个类的compareAndSet方法的作用是首先检查当前引用是否等于预期引用,并且检查当前标志是否等于预期标志,如果二者都相等,才使用CAS设置为新的值和标志。

    CAS多与自旋结合。如果自旋CAS长时间不成功,会占用大量的CPU资源。

    解决思路是让JVM支持处理器提供的pause指令

    这个问题你可能已经知道怎么解决了。有两种解决方案:

    1. 使用JDK 1.5开始就提供的类保证对象之间的原子性,把多个变量放到一个对象里面进行CAS操作;
    2. 使用锁。锁内的临界区代码可以保证只有当前线程能操作。

    参考资料

    1. 对 volatile、compareAndSet、weakCompareAndSet 的一些思考
    2. 《Java 并发编程的艺术》