当前位置: 首页 > news >正文

架构师面试(二十):CAP 定理

问题

【CAP定理】是理解和研发分布式系统必须要掌握的一个关键知识点!

CAP是计算机科学家埃里克.布鲁尔在2000年提出的一个猜想(所以又叫做布鲁尔定理),在2002年又有两位计算机的大佬发布了 布鲁尔猜想的证明。 

今天的问题比较简单(因为网上资料颇多),但是能回答全面和有深度,也不容易哦(因为网上资料虽多但繁杂)。 

你是如何理解 CAP 定理的呢?在大厂面试时应该如何全面和深度回答?

解析

我们先来解析一下【CAP】中的这三个字母:

C,Consistency,即一致性,是指对于指定的某个客户端来说的,每一次的读操作一定能获取到最新写入的数据;这个地方,一定要切记:不要站在存储节点的角度来说明,因为存储节点之间一定会存在数据不一致的时间窗口,哪怕存储节点之间使用了光纤通信,只是时间窗口大小的问题;我们能做到的是让客户端能看到的【一致性】的特征。

A,Availability,即可用性,是指客户端在访问非故障节点时能在合理时间内获取到合理的结果;有几个点需要注意:(1)首先客户端访问的是故障节点,这个情况需要排除,毕竟死马当做活马医,肯定不合理;(2)然后客户端获取到的是合理的结果,这个结果可以是滞后的(可以不是最新的),但一定是合理的数据(不能为了系统降级随意生成);(3)再一个,也是最关键的(这一点很多人会忽略),客户端获取的响应结果,不是异常、不是错误、不是超时;(重要的事情说三遍)可用性是指获取到合理的结果,结果不能异常、不能错误、不能超时......不能异常、不能错误、不能超时......不能异常、不能错误、不能超时。

P,Partition Tolerance,即分区容忍性(或分区容错性),是指网络发生分区后系统仍然在履行它的职责;分区容忍性比较好理解,需要明白的是网络分区发生的原因,可能是消息丢失、也可能是网络中断、也可能是网络拥塞等等,也就是我们常说的网络脑裂;再一个网络分区后,系统要继续履行它的职责,不是很笼统地返回一个 502 或 503就了事,而是在真正地工作。

明白了上面三个子母的含义后,就可以解释【CAP】了:

在对分布式系统进行读写操作时,只能保证C、A、P三者中的两个,另外一个必须被牺牲。

这里有几个关键点需要特别注意:

(1)  CAP 适用的对象不是泛指分布式系统,而是节点之间有连接和存在数据共享的分布式系统;比如 主从模式的 MySQL 就适用 CAP,Memcache 集群就不适合 CAP;

(2)  CAP 适用的操作是【读和写】两种行为,其他行为不适合,比如:选主;

(3)  C、A、P 进行三选二,就形成了三种模式,即:AP 模式、CP 模式和 CA 模式。

AP 模式,即网络发生分区后,系统要满足可用性的基础上继续履行职责;在实际系统研发时,就不要 C 了吗?非也,在网络分区恢复后,仍然需要将过时的数据及时更新到最新。

CP 模式,即网络发生分区后,系统要满足一致性的基础上继续履行职责,如果能判定客户端请求的数据是最新和一致的,则返回,否则返回系统错误。

CA 模式,即网络没有发生分区,系统需要满足一致性和可用性,客户端访问任何一个非故障节点都可以获取到最新的数据。

CAP定理,始终是理论上的定理,能帮助我们深入理解分布式系统;在实际研发时理论和实践往往会存在差距。比如:Zookeeper 系统,我们都知道它是 CP 模式的分布式系统;它通过ZAB协议(即过半写入)对数据进行写入,那么当客户端访问的节点是落后写入的节点时,岂非返回的是落后的数据(也是合理的数据),也就是此时是 AP 模式的行为;该当何解?这就是 理论和实践的差距。Zookeeper 为了平衡性能和一致性,故采取此机制:如果客户端追求的是返回数据的性能而非最新数据,则落后节点可以直接返回数据;如果客户端追求的是最新数据而非性能,则客户端可以通过 sync()函数,使落后节点与Leader进行交互,获取到最新数据之后再返回。妙哉!

相关文章:

  • 自定义mavlink 生成wireshark wlua插件错误(已解决)
  • 【拒绝算法PUA】LeetCode 2116. 判断一个括号字符串是否有效
  • VLM理解(一)——视觉文本信息的标注与数据集制作过程
  • 第十一章 | 智能合约主网部署与验证详解
  • 6、linux c 线程 -下
  • 同旺科技USB to I2C 适配器 ---- 多从机设备混合调试
  • 关于解决Ubuntu终端及系统字体大小的问题
  • Java 24 学习
  • WebSocket:现代实时通信协议的深度解析与实践
  • Mysql笔记
  • el-table单元格编辑,动态增删行,回车/上下左右箭头切换单元格
  • cpp-友元
  • 马科维茨均值—方差理论推导过程
  • 分布式系统设计陷阱,白话CAP理论
  • CVE-2020-0796:永恒之黑实战学习
  • Redis + 布隆过滤器解决缓存穿透问题
  • 微服务 - 中级篇
  • WebLogic中间件常见漏洞
  • sqrt函数(豆包)
  • 【leetcode100】搜索二维矩阵
  • 王星昊再胜连笑,夺得中国围棋天元赛冠军
  • 秦洪看盘|浮现新预期,存量资金积极调仓
  • 全国电影工作会:聚焦扩大电影国际交流合作,提升全球影响力
  • 消费维权周报|上周违规经营类投诉较多,涉诱导加盟等
  • 恒瑞医药赴港上市获证监会备案,拟发行不超8.15亿股
  • 上海明天起进入“升温通道”,五一假期冲刺33℃