zookeeper一致性算法.docx
《zookeeper一致性算法.docx》由会员分享,可在线阅读,更多相关《zookeeper一致性算法.docx(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、zookeeper 一致性算法上次跟学弟学妹们聊完了 Spring相关的一些知识点,学弟学妹们还是挺开心的, 但是上次有学弟在跟我留言,在出去面试的时候被面试官问了个一脸蒙逼急的问 题:zookeeper你用过吗?作为注册中心它是怎么如何保证CP的呢?为了对的起学弟学妹们的信赖这次跟大家具体聊聊zookeeper中的一致性选举算 法Paxos算法什么是CAP?CAP理论指的是在一个分布式系统中,不可能同时满足Consistency(一致性)、Avai labl i ty (可用性)、Partition tolerance (分区容错性)这三个基本需求,最多只能满足其中的两项。一致性(Consi
2、stency):数据在不同的副本之间数据是保持一致的, 并且当执行数据更新之后,各个副本之间能然是处于一致的状态。可用性(Availablity):系统提供的服务必须是处于一直可用的状态,针对每一次对系统的请求操作在设定的时间内,都能得到正常的 result 返回 o分区容错性(Partition tolerance):分布式系统在遇到任何网络 分区故障的时候,仍然需要能够保证对外提供满足一致性和可用性的 服务,除非整个网络环境全部瘫痪了。什么是三二原则?对于分布式系统,在CAP原则中,P是一定要保证的,如果没有分区容错性那这个系统就太脆落了,但是并不能同时保证一致性或者可用 性,在现在我们的
3、分布式系统中,满足一致性,则必然会失去可用性,AcceptorThree (决策者3)本地N值为4到此第一阶段的工作就已经完成了,整个流程都是文字较多,看起需要多看几遍。同时我也给大家画了一个流程图如下:p,opose,One EPaxos 等等。Zookeeper在zookeeper中的选举算法就是用的 Fast Paxos算法,为什么用Fast paxos?Fast Paxos算法是Paxos的优化版本,解决了 Paxos算法的活锁问题保证每次线程过来获取到唯一的N值。ZAB (Zookeeper Atomic Broadcast)原子广播协议ZAB其实就是上面算法的一种实现,所以Zook
4、eeper也就是依赖ZAB来实现分布式数据的一致性的。所以在zookeeper中,只有一台服务器机器作为leader机器,所以当客户端链接 到机器的某一个节点时当这个客户端提交的是读取数据请求,那么当前连接的机器节点,就会把自己保 存的数据返回出去。当这个客户端提交的是写数据请求时,首先会看当前连接的节点是不是leader 节点,如果不是leader节点则会转发出去到leader机器的节点上,由leader 机器写入,然后广播出去通知其他的节点过来同步数据在ZAB中的三类角色Leader: ZK集群的老大,唯一的一个可以进行写数据的机器。Follower: ZK集群的具有一定职位的干活人。只能
5、进行数据的读取,当老 大(leader)机器挂了之后可以参与选举投票的机器。Observe:最小的干活小弟,只能进行数据读取,就算老大(leader)机器 挂了,跟他一毛关系没有,不能参与选举投票的机器。在ZAB中的三个重点数据Zxid:是zookeeper中的事务ID,总长度为64位的长度的Long类型数据。其中有两部分构成前32位是epoch后32位是xidEpoch:每一个leader都会有一个这个值,表示当前leader获取到的最大N值,可以理解为“年代”Xid:事务ID,表示当前zookeeper集群当前提交的事物ID是多少(watch 机制),方便选举的过程后不会出现事务重复执行或
6、者遗漏等一些特殊情况。zookeeper中的一些知识点就分享到这里了,因为这里面还有很多很多东西,比 如Session 、Znode、Watcher机制 、ACL三种状态模式 还zookeeper怎么 实现分布式事务锁等等。没有办法一次性跟大家聊完。这次主要还是想让学弟学妹了解清楚Zookeeper中的一致性的算法是怎么保证。结尾针对面试来说能完全的跟面试官讲明白这个一致性算法,那你就已经走在前面了。整个过程还是比较复杂的,需要自己不断的多看多画图理解。在这个互联内卷的时代,只有懂得比别人多才能走的比别人远。最后希望我的学弟学妹们都能有一个好的校招结果!满足可用性,则必然失去一执性。所以CAP
7、原则对一个分布式系统来 说要么满足AP,要么满足CP,这就是三二原则。Zookeeper 与 Eureka 的区别?Zookeeper遵循是的CP原则,即保证了一致性,失去了可用性,体 现在当Leader宕机后,zk集群会马上进行新的Leader的选举, 但是选举的这个过程是处于瘫痪状态的。所以其不满足可用性。Eureka遵循的是AP原则,即保证了高可用,失去了一执行。每台服 务器之间都有心跳检测机制,而且每台服务器都能进行读写,通过心 跳机制完成数据共享同步,所以当一台机器宕机之后,其他的机器可 以正常工作,但是可能此时宕机的机器还没有进行数据共享同步,所 以其不满足一致性。言归正转,基础就
8、跟大家聊到这里了,开始直接开始正文吧! !Paxos算法Paxos算法是莱斯利兰伯特(Leslie Lamport) 1990年提出的一种 基于消息传递的、具有高容错性的一致性算法。Google Chubby的作 者Mike Burrows说过,世上只有一种一致性算法,那就是Paxos, 所有其他一致性算法都是Paxos算法的不完整版。Paxos算法是一种公认的晦涩难懂的算法,并且工程实现上也具有很 大难度。所以Paxos算法主要用来解决我们的分布式系统中如何根据表决达 成一致。算法前置理解首先需要理解的是算法中的三种角色Proposer (提议者)Acceptor (决策者)Learners
9、 (群众)一个提案的决策者(Acceptor)会存在多个,但在一个集群中提议者(Proposer)也 是可能存在多个的,不同的提议者(Proposer)会提出不同的提案。paxos算法特点: 没有提案被提出则不会有提案被选定。 每个提议者在提出提案时都会首先获取到一个具有全局唯一性的、递 增的提案编号N,即在整个集群中是唯一的编号N,然后将该编号 赋予其要提出的提案。(在zookeeper中就是zxid,由epoch和xid 组成)每个表决者在accept某提案后,会将该提案的编号N记录在本地, 这样每个表决者中保存的已经被accept的提案中会存在一个编号 最大的提案,其编号假设为maxNo
10、每个表决者仅会accept编号大 于自己本地niaxN的提案。 在众多提案中最终只能有一个提案被选定。 一旦一个提案被选定,则其它服务器会主动同步(Learn)该提案到本 地。Paxos算法整个选举的过程可以分为两个阶段来理解。阶段一这个阶段主要是准备阶段发送提议提议者(Proposer)准备提交一个编号为N的提议,于是其首先向所有表决者(Acceptor)发送prepare (N)请求,用于试探集群是否支持该编号的提议。每个决策者(Acceptor)中都保存着自己曾经accept过的提议中的最大编号maxNo当一个表决者接收到其它主机发送来的prepare (N) 请求时,其会比较N与max
11、N的值。若N小于maxN,则说明该提议已过时,当前表决者采取不回应来 拒绝该prepare请求若N大于maxN,则说明该提议是可以接受的,当前表决者会首先将 该N记录下来, 并将其曾经已经accept的编号最大的提案 Proposal (myid, maxN, value)反馈给提议者,以向提议者展示自己支 持的提案意愿。其中第一个参数myid表示表决者Acceptor的标 识id,第二个参数表示其曾接受的提案的最大编号maxN,第三个 参数表示该提案的真正内容valueo若当前表决者还未曾accept过任何提议(第一次初始化的时候), 则会将Proposal (myid, null, nul
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- zookeeper 一致性 算法
限制150内