1.CAS介绍
什么是 CAS
CAS(Compare And Swap,比较与交换),是非阻塞同步的实现原理,它是CPU硬件层面的一种指令,从CPU层面能保证"比较与交换"两个操作的原子性。CAS指令操作包括三个参数:内存值(内存地址值)V、预期值E、新值N,当CAS指令执行时,当且仅当预期值E和内存值V相同时,才更新内存值为N,否则就不执行更新,无论更新与否都会返回否会返回旧的内存值V,上述的处理过程是一个原子操作。

用Java代码等效实现一下CAS的执行过程:
CAS(Compare And Swap,比较与交换),是非阻塞同步的实现原理,它是CPU硬件层面的一种指令,从CPU层面能保证"比较与交换"两个操作的原子性。CAS指令操作包括三个参数:内存值(内存地址值)V、预期值E、新值N,当CAS指令执行时,当且仅当预期值E和内存值V相同时,才更新内存值为N,否则就不执行更新,无论更新与否都会返回否会返回旧的内存值V,上述的处理过程是一个原子操作。

用Java代码等效实现一下CAS的执行过程:
public class CASDemo {// 内存中当前的值private volatile int ramAddress;/*** @param expectedValue 期望值* @return newValue 更新的值**/public synchronized int compareAndSwap(int expectedValue, int newValue) {//TODO 模拟直接从内存地址读取到内存中的值int oldRamAddress = accessMemory(ramAddress);//内存中的值和期望的值进行比较if (oldRamAddress == expectedValue) {ramAddress = newValue;}return oldRamAddress;}private int accessMemory(int ramAddress) {//TODO 模拟直接从内存地址读取到内存中的值return ramAddress;}}
以上伪代码描述了一个由比较和赋值两阶段组成的复合操作,CAS 可以看作是它们合并后的整体——一个不可分割的原子操作,并且其原子性是直接在硬件层面得到保障的。
CAS是一种无锁算法,在不使用锁(没有线程被阻塞)的情况下实现多线程之间的变量同步。CAS可以看做是乐观锁(对比数据库的悲观、乐观锁)的一种实现方式,Java原子类中的递增操作就通过CAS自旋实现的。
在 Java 中,CAS 操作是由 Unsafe 类提供支持的,该类定义了三种针对不同类型变量的 CAS 操作,如图

它们都是 native 方法,由 Java 虚拟机提供具体实现,这意味着不同的 Java 虚拟机对它们的实现可能会略有不同。
Unsafe是位于sun.misc包下的一个类,主要提供一些用于执行低级别、不安全操作的方法,如直接访问系统内存资源、自主管理内存资源等,这些方法在提升Java运行效率、增强Java语言底层资源操作能力方面起到了很大的作用。但由于Unsafe类使Java语言拥有了类似C语言指针一样操作内存空间的能力,这无疑也增加了程序发生相关指针问题的风险。在程序中过度、不正确使用Unsafe类会使得程序出错的概率变大,使得Java这种安全的语言变得不再“安全”,因此对Unsafe的使用一定要慎重。
以 compareAndSwapInt 为例,Unsafe 的 compareAndSwapInt 方法接收 4 个参数,分别是:对象实例、内存偏移量、字段期望值、字段新值。该方法会针对指定对象实例中的相应偏移量的字段执行 CAS 操作。
public class CASTest {public static void main(String[] args) {Entity entity = new Entity();Unsafe unsafe = UnsafeFactory.getUnsafe();long offset = UnsafeFactory.getFieldOffset(unsafe, Entity.class, "x");boolean successful;// 4个参数分别是:对象实例、字段的内存偏移量、字段期望值、字段新值successful = unsafe.compareAndSwapInt(entity, offset, 0, 3);System.out.println(successful + "\t" + entity.x);successful = unsafe.compareAndSwapInt(entity, offset, 3, 5);System.out.println(successful + "\t" + entity.x);successful = unsafe.compareAndSwapInt(entity, offset, 3, 8);System.out.println(successful + "\t" + entity.x);}}public class UnsafeFactory {/*** 获取 Unsafe 对象* @return*/public static Unsafe getUnsafe() {try {Field field = Unsafe.class.getDeclaredField("theUnsafe");field.setAccessible(true);return (Unsafe) field.get(null);} catch (Exception e) {e.printStackTrace();}return null;}/*** 获取字段的内存偏移量* @param unsafe* @param clazz* @param fieldName* @return*/public static long getFieldOffset(Unsafe unsafe, Class clazz, String fieldName) {try {return unsafe.objectFieldOffset(clazz.getDeclaredField(fieldName));} catch (NoSuchFieldException e) {throw new Error(e);}}}
测试
针对 entity.x 的 3 次 CAS 操作,分别试图将它从 0 改成 3、从 3 改成 5、从 3 改成 8。执行结果如下:

CAS在java.util.concurrent.atomic相关类、Java AQS、CurrentHashMap等实现上有非常广泛的应用。如下图所示,AtomicInteger的实现中,静态字段valueOffset即为字段value的内存偏移地址,valueOffset的值在AtomicInteger初始化时,在静态代码块中通过Unsafe的objectFieldOffset方法获取。在AtomicInteger中提供的线程安全方法中,通过字段valueOffset的值可以定位到AtomicInteger对象中value的内存地址,从而可以根据CAS实现对value字段的原子操作。

下图为某个AtomicInteger对象自增操作前后的内存示意图,对象的基地址baseAddress=“0x110000”,通过baseAddress+valueOffset得到value的内存地址valueAddress=“0x11000c”;然后通过CAS进行原子性的更新操作,成功则返回,否则继续重试,直到更新成功为止。

Hotspot 虚拟机对compareAndSwapInt 方法的实现如下:
#unsafe.cppUNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))UnsafeWrapper("Unsafe_CompareAndSwapInt");oop p = JNIHandles::resolve(obj);// 根据偏移量,计算value的地址jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);// Atomic::cmpxchg(x, addr, e) cas逻辑 x:要交换的值 e:要比较的值//cas成功,返回期望值e,等于e,此方法返回true//cas失败,返回内存中的value值,不等于e,此方法返回falsereturn (jint)(Atomic::cmpxchg(x, addr, e)) == e;UNSAFE_END2
核心逻辑在Atomic::cmpxchg方法中,这个根据不同操作系统和不同CPU会有不同的实现。这里我们以linux_64x的为例,查看Atomic::cmpxchg的实现
#atomic_linux_x86.inline.hppinline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {//判断当前执行环境是否为多处理器环境int mp = os::is_MP();//LOCK_IF_MP(%4) 在多处理器环境下,为 cmpxchgl 指令添加 lock 前缀,以达到内存屏障的效果//cmpxchgl 指令是包含在 x86 架构及 IA-64 架构中的一个原子条件指令,//它会首先比较 dest 指针指向的内存值是否和 compare_value 的值相等,//如果相等,则双向交换 dest 与 exchange_value,否则就单方面地将 dest 指向的内存值交给exchange_value。//这条指令完成了整个 CAS 操作,因此它也被称为 CAS 指令。__asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)": "=a" (exchange_value): "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp): "cc", "memory");return exchange_value;}
cmpxchgl的详细执行过程:
首先,输入是"r" (exchange_value), “a” (compare_value), “r” (dest), “r” (mp),表示compare_value存入eax寄存器,而exchange_value、dest、mp的值存入任意的通用寄存器。嵌入式汇编规定把输出和输入寄存器按统一顺序编号,顺序是从输出寄存器序列从左到右从上到下以“%0”开始,分别记为%0、%1···%9。也就是说,输出的eax是%0,输入的exchange_value、compare_value、dest、mp分别是%1、%2、%3、%4。
因此,cmpxchg %1,(%3)实际上表示cmpxchg exchange_value,(dest)
需要注意的是cmpxchg有个隐含操作数eax,其实际过程是先比较eax的值(也就是compare_value)和dest地址所存的值是否相等,
输出是"=a" (exchange_value),表示把eax中存的值写入exchange_value变量中。
Atomic::cmpxchg这个函数最终返回值是exchange_value,也就是说,如果cmpxchgl执行时compare_value和dest指针指向内存值相等则会使得dest指针指向内存值变成exchange_value,最终eax存的compare_value赋值给了exchange_value变量,即函数最终返回的值是原先的compare_value。此时Unsafe_CompareAndSwapInt的返回值(jint)(Atomic::cmpxchg(x, addr, e)) == e就是true,表明CAS成功。如果cmpxchgl执行时compare_value和(dest)不等则会把当前dest指针指向内存的值写入eax,最终输出时赋值给exchange_value变量作为返回值,导致(jint)(Atomic::cmpxchg(x, addr, e)) == e得到false,表明CAS失败。
现代处理器指令集架构基本上都会提供 CAS 指令,例如 x86 和 IA-64 架构中的 cmpxchgl 指令和 comxchgq 指令,sparc 架构中的 cas 指令和 casx 指令。
不管是 Hotspot 中的 Atomic::cmpxchg 方法,还是 Java 中的 compareAndSwapInt 方法,它们本质上都是对相应平台的 CAS 指令的一层简单封装。CAS 指令作为一种硬件原语,有着天然的原子性,这也正是 CAS 的价值所在。
CAS 虽然高效地解决了原子操作,但是还是存在一些缺陷的,主要表现在三个方面:
CAS算法实现一个重要前提需要取出内存中某时刻的数据,而在下时刻比较并替换,那么在这个时间差类会导致数据的变化。
当有多个线程对一个原子类进行操作的时候,某个线程在短时间内将原子类的值A修改为B,又马上将其修改为A,此时其他线程不感知,还是会修改成功。

测试
@Slf4jpublic class ABATest {public static void main(String[] args) {AtomicInteger atomicInteger = new AtomicInteger(1);new Thread(()->{int value = atomicInteger.get();log.debug("Thread1 read value: " + value);// 阻塞1sLockSupport.parkNanos(1000000000L);// Thread1通过CAS修改value值为3if (atomicInteger.compareAndSet(value, 3)) {log.debug("Thread1 update from " + value + " to 3");} else {log.debug("Thread1 update fail!");}},"Thread1").start();new Thread(()->{int value = atomicInteger.get();log.debug("Thread2 read value: " + value);// Thread2通过CAS修改value值为2if (atomicInteger.compareAndSet(value, 2)) {log.debug("Thread2 update from " + value + " to 2");// do somethingvalue = atomicInteger.get();log.debug("Thread2 read value: " + value);// Thread2通过CAS修改value值为1if (atomicInteger.compareAndSet(value, 1)) {log.debug("Thread2 update from " + value + " to 1");}}},"Thread2").start();}}
Thread1不清楚Thread2对value的操作,误以为value=1没有修改过

数据库有个锁称为乐观锁,是一种基于数据版本实现数据同步的机制,每次修改一次数据,版本就会进行累加。
同样,Java也提供了相应的原子引用类AtomicStampedReference

reference即我们实际存储的变量,stamp是版本,每次修改可以通过+1保证版本唯一性。这样就可以保证每次修改后的版本也会往上递增。
@Slf4jpublic class AtomicStampedReferenceTest {public static void main(String[] args) {// 定义AtomicStampedReference Pair.reference值为1, Pair.stamp为1AtomicStampedReference atomicStampedReference = new AtomicStampedReference(1,1);new Thread(()->{int[] stampHolder = new int[1];int value = (int) atomicStampedReference.get(stampHolder);int stamp = stampHolder[0];log.debug("Thread1 read value: " + value + ", stamp: " + stamp);// 阻塞1sLockSupport.parkNanos(1000000000L);// Thread1通过CAS修改value值为3if (atomicStampedReference.compareAndSet(value, 3,stamp,stamp+1)) {log.debug("Thread1 update from " + value + " to 3");} else {log.debug("Thread1 update fail!");}},"Thread1").start();new Thread(()->{int[] stampHolder = new int[1];int value = (int)atomicStampedReference.get(stampHolder);int stamp = stampHolder[0];log.debug("Thread2 read value: " + value+ ", stamp: " + stamp);// Thread2通过CAS修改value值为2if (atomicStampedReference.compareAndSet(value, 2,stamp,stamp+1)) {log.debug("Thread2 update from " + value + " to 2");// do somethingvalue = (int) atomicStampedReference.get(stampHolder);stamp = stampHolder[0];log.debug("Thread2 read value: " + value+ ", stamp: " + stamp);// Thread2通过CAS修改value值为1if (atomicStampedReference.compareAndSet(value, 1,stamp,stamp+1)) {log.debug("Thread2 update from " + value + " to 1");}}},"Thread2").start();}}
Thread1并没有成功修改value

补充:AtomicMarkableReference可以理解为上面AtomicStampedReference的简化版,就是不关心修改过几次,仅仅关心是否修改过。因此变量mark是boolean类型,仅记录值是否有过修改。
