什么是CAS(COMPARE AND SWAP)
CAS(Compare And Swap)是一种原子操作,用于保证在无锁情况下的数据一致性的问题。在无锁情况下,假设有两个线程 A 和 B,他们都读取某一个值 V,修改后再存回内存中,当它们并行执行时,就可能会引起数据 V 的不一致问题。
CAS 的具体操作是比较和替换,即第一步比较指定值和内存中的值是否一致,若一致则使用新值对内存值进行替换。
不一致问题的举例
假设有两个线程 A 和 B,它们分别对数据 V(值为100)执行加 10 和减 10 的操作,代码执行过程如下:
线程A对数据V的操作:
- 从内存中读取数据 V(100);
- (在线程中)将数据 V加10;
- 将加法的结果 V1(110)存入内存中原来的位置(替换掉旧的 V)。
线程 B 对数据 V 的操作:
- 从内存中读取数据 V(100);
- (在线程中)将数据 V 减 10;
- 将减法的结果 V2(90)存入内存中原来的位置(替换掉旧的 V)。
假设这两个线程并发执行,且 A 首先获得 CPU 时间片,在 A 的 CPU 时间内,它先读取数据 V 的值,并将其进行了加法操作,获得数据 V1(110)。此时,A 的 CPU 时间片结束,线程 B 开始执行。B 将数据 V 读入(此时数据V未被改动),并执行了减法操作,获得数据 V2(90)。此时,B 的 CPU 时间片结束,线程 A 继续执行,A 将 V1(110)存入内存,A 线程结束。B 继续执行,B 将 V2(90)存入内存,B 线程结束。
我们可以看到,此时内存中的数据 V 已经变成了 V2(90),与我们原先以为的100(加十减十)预期不同,造成了数据不一致的问题。
使用CAS解决数据不一致问题
CAS 可以用于解决上述数据不一致问题,假设线程 A 和 B 都使用了 CAS 方式,那么他们的执行步骤为:
线程 A 对数据 V 的操作:
- 从内存中读取数据 V(100);
- (在线程中)将数据 V 加 10;
- 执行 CAS 操作,比较第一步读取的 V 值(100)与现在内存中的 V 值是否相等,若相等则继续;否则返回执行第一步;
- 将加法的结果 V1(110)存入内存中原来的位置(替换掉旧的 V)。
线程B对数据V的操作:
- 从内存中读取数据 V(100);
- (在线程中)将数据 V 减 10;
- 执行 CAS 操作,比较第一步读取的 V 值(100)与现在内存中的 V 值是否相等,若相等则继续;否则返回执行第一步;
- 将减法的结果 V2(90)存入内存中原来的位置(替换掉旧的 V)。
流程修改后,在执行过程中,当 A 线程执行结束后,内存中的值已经变为 V1(110),线程B在存入新的值之前首先比较 V1 是否与 V 相同,因为内存中的值已经修改,所以线程B需要重新执行读取操作,从第一步重新执行,将 V1(110)减 10 在存入内存,得到 V(100)与预期一致,从而确保了数据的一致问题。
实现
CAS 操作基于 CPU 提供的原子操作指令实现。对于 Intel X86 处理器,可通过在汇编指令前增加 LOCK 前缀来锁定系统总线,使系统总线在汇编指令执行时无法访问相应的内存地址。而各个编译器根据这个特点实现了各自的原子操作函数。[1]
- C语言,C11 的头文件 stdatomic.h。由 GNU 提供了对应的 __sync 系列函数完成原子操作。
- C++11,STL 提供了 atomic 系列函数。
- JAVA,sun.misc.Unsafe 提供了 compareAndSwap 系列函数。
- C#,通过 Interlocked 方法实现。
- Go, 通过 import “sync/atomic” 包实现。
- Windows,通过 Windows API 实现了 InterlockedCompareExchangeXYZ 系列函数。
外部链接
[1] 引用自 Wikipedia CAS 词条:网页链接。
以上。