CAP理论起源于 2000 年,由加州大学伯克利分校的 Eric Brewer 传授在分布式计算原理研讨会(PODC)上提出,因此 CAP 定理又被称作 布鲁尔定理(Brewer’s theorem)
2 年后,麻省理工学院的 Seth Gilbert 和 Nancy Lynch 发表了布鲁尔料想的证明,CAP 理论正式成为分布式范畴的定理。
简介
CAP 也就是 Consistency(一致性)、Availability(可用性)、Partition Tolerance(分区容错性) 这三个单词首字母组合。
CAP 理论的提出者布鲁尔在提出 CAP 料想的时候,并没有详细界说 Consistency、Availability、Partition Tolerance 三个单词的明确界说。
因此,对于 CAP 的民间解读有许多,一样平常比较被大家推荐的是下面这种版本的解读。
在理论计算机科学中,CAP 定理(CAP theorem)指出对于一个分布式系统来说,当设计读写操作时,只能同时满足以下三点中的两个:
大部分人表明这一定律时,常常简单的表述为:“一致性、可用性、分区容忍性三者你只能同时达到此中两个,不大概同时达到”。实际上这是一个非常具有误导性子的说法,而且在 CAP 理论诞生 12 年之后,CAP 之父也在 2012 年重写了之前的论文。
在实际应用中,由于网络分区是不可避免的,所以在CAP中通常只能在C和A之间做出选择。 当发生网络分区的时候,如果我们要继续服务,那么强一致性和可用性只能 2 选 1。也就是说当网络分区之后 P 是条件,决定了 P 之后才有 C 和 A 的选择。也就是说分区容错性(Partition tolerance)我们是必须要实现的。简而言之就是:CAP 理论中分区容错性 P 是一定要满足的,在此基础上,只能满足可用性 A 或者一致性 C。
因此,分布式系统理论上不大概选择 CA 架构,只能选择 CP 或者 AP 架构。 比如 ZooKeeper、HBase 就是 CP 架构,Cassandra、Eureka 就是 AP 架构,Nacos 不仅支持 CP 架构也支持 AP 架构。 为啥不大概选择 CA 架构呢? 举个例子:若系统出现“分区”,系统中的某个节点在举行写操作。为了保证 C, 必须要禁止其他节点的读写操作,这就和 A 发生辩论了。如果为了保证 A,其他节点的读写操作正常的话,那就和 C 发生辩论了。
例如:假设有一个分布式数据库,分布在两个数据中心A和B。如果A和B之间的网络毗连断开:
在举行分布式系统设计和开发时,不应该仅仅范围在 CAP 问题上,还要关注系统的扩展性、可用性等等
在系统发生“分区”的情况下,CAP 理论只能满足 CP 或者 AP。要注意的是,这里的条件是系统发生了“分区”
如果系统没有发生“分区”的话,节点间的网络毗连通讯正常的话,也就不存在 P 了。这个时候,我们就可以同时保证 C 和 A 了。
总结:如果系统发生“分区”,我们要考虑选择 CP 还是 AP。如果系统没有发生“分区”的话,我们要思考怎样保证 CA 。
BASE 理论
BASE 理论起源于 2008 年, 由 eBay 的架构师 Dan Pritchett 在 ACM 上发表。
简介
BASE 是 Basically Available(基本可用)、Soft-state(软状态) 和 Eventually Consistent(最终一致性) 三个短语的缩写。BASE 理论是对 CAP 中一致性 C 和可用性 A 权衡的结果,是对CAP中AP的一个延伸,其来源于对大规模互联网系统分布式实践的总结,是基于 CAP 定理逐步演化而来的,它大大降低了我们对系统的要求。
BASE 理论的核心头脑
纵然无法做到强一致性,但每个应用都可以根据自身业务特点,采用得当的方式来使系统达到最终一致性。
也就是牺牲数据的一致性来满足系统的高可用性,系统中一部分数据不可用或者不一致时,仍需要保持系统整体“重要可用”。 BASE 理论本质上是对 CAP 的延伸和补充,更具体地说,是对 CAP 中 AP 方案的一个补充。 为什么这样说呢?
如果系统没有发生“分区”的话,节点间的网络毗连通讯正常的话,也就不存在 P 了。这个时候,我们就可以同时保证 C 和 A 了。因此,如果系统发生“分区”,我们要考虑选择 CP 还是 AP。如果系统没有发生“分区”的话,我们要思考怎样保证 CA 。
因此,AP 方案只是在系统发生分区的时候放弃一致性,而不是永远放弃一致性。在分区故障恢复后,系统应该达到最终一致性。这一点其实就是 BASE 理论延伸的地方。
BASE 理论三要素