Redis探秘Sentinel(哨兵模式)

打印 上一主题 下一主题

主题 776|帖子 776|积分 2328

概述

Redis的高可用机制有持久化、复制、哨兵和集群。其主要的作用和办理的问题分别是:

  • 持久化:持久化是最简朴的高可用方法(有时甚至不被归为高可用的本领),主要作用是数据备份,即将数据存储在硬盘,保证数据不会因历程退出而丢失。
  • 复制:复制是高可用Redis的基础,哨兵和集群都是在复制基础上实现高可用的。复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简朴的故障恢复。缺陷:故障恢复无法自动化;写操作无法负载均衡;存储本领受到单机的限制。
  • 哨兵:哨兵实现了主从复制中故障的自动化恢复。缺陷:写操作无法负载均衡;存储本领受到单机的限制。
  • 集群:通过集群,办理了写操作无法负载均衡,以及存储本领受到单机限制的问题,实现了较为完善的高可用方案。
本文这里将介绍Redis的哨兵机制。
为什么要有哨兵

Redis的主从模式重点在于办理整体的承压本领,利用从节点分担读取操作的压力。但是其在容错恢复等可靠性层面短缺明显,不具备自动的故障转移与恢复本领:

  • 假如slave从节点宕机,整个redis依旧可以正常提供服务,待slave节点重新启动后,可以恢复从master节点的数据同步、然后继续提供服务。
  • 假如master主节点宕机,则redis功能受损,无法继续提供写服务,直到手动修复master节点方可恢复。
固然,master节点故障后,也可以手动将其中一个从节点切换为新的master节点来恢复故障。而原先的master节点恢复后,必要手动将其降级为slave节点,对外提供只读服务。
实际利用的时候,手动故障恢复的时效无法得到保证,为了支持自动的故障转移与恢复本领,Redis在主从模式的基础上进行优化增强,提供了哨兵(Sentinel)架构模式。
那么就必要有一个机制,能够监测主节点是否存活,假如发现主节点挂了,就选举一个从节点切换为主节点,并且把新主节点的相关信息通知给从节点和客户端。
那么就有以下三个问题必要办理:

  • 主库真的挂了吗?
  • 选择哪个从库作为主库?
  • 怎样把新主库相关信息通知给从库和客户端
哨兵机制流程

Redis的哨兵模式,就是在主从模式的基础上,额外部署若干独立的哨兵历程,通过哨兵历程去监视者Redis主从节点的状态,一旦发现主节点宕机,则哨兵可以重新从剩余slave节点中推选一个新的节点并将其升级为master节点,以此保证整个系统功能可以正常利用。
哨兵负责三个任务:监控,选主(选择主库)和通知。

  • 监控:监控是指哨兵历程运行时,周期性(默认1秒)给全部主从节点发送 PING 下令,当主从节点收到 PING 下令后,会发送一个响应下令给哨兵,如许就可以检测他们是否仍然在线运行。

    • 从库没有在规定时间内响应哨兵的PING下令,哨兵就会把它标记为"下线状态";
    • 主库没有在规定时间呢响应哨兵的PING下令,哨兵就会判定主库下线启动选主流程。

  • 选主:哨兵在主库挂了以后,按照一定规则从从库中选出作为新的主库。
  • 通知:哨兵将选出的新主库连接信息发给其他从库,从库和新主库创建连接,执行replicaof下令,复制数据。同时,哨兵会把新主库的连接信息通知给客户端,让它们将操作请求发送给新主库上。
监控:怎样判断主库是否真的挂了

哨兵历程会利用PING下令检测主和从库的连接环境,用来判断实例状态;
假如哨兵发现主库大概从库对PING下令响应超时,那么哨兵就会把它标记为"主观下线"。

  • 对于从库,哨兵可以简朴标记为"主观下线",因为从库下线影响不大,集群对外服务不会中断。
  • 对于主库,哨兵不能简朴标记为"主观下线",开启主从切换。因为可能存在一种环境:哨兵误判,主库没有故障,可是一旦启动选主和通知操作后续的选主和通知操作都会带来额外的计算和通讯开销。还可能产生脑裂。
确认主库下线了,主库才能被标记为客观下线。必要留意的是客观下线是主节点才有的概念;假如从节点和哨兵节点发生故障,被哨兵主观下线后,不会再有后续的客观下线和故障转移操作。
什么是误判?
主库实际没有下线,但是哨兵以为它下线了。误判产生原因:比如集群网络压力较大,出现网络拥塞,大概主库本身压力较大,导致主节点没有在规定时间内响应哨兵的 PING 下令。
因此,这里有两个问题:

  • 必要只管避免误判 - 少数服从多数
  • 有两个哨兵都判断主库是客观下线了,那么由哪个哨兵进行主从故障转移
少数服从多数机制

哨兵集群:哨兵以多实例组成的集群模式进行部署(最少必要三台呆板来部署哨兵集群)。通过多个哨兵节点一起判断,就可以就可以避免单个哨兵因为自身网络状况欠好,而误判主节点下线的环境。同时,多个哨兵网络同时不稳固的概率较小,让它们一起决策让误判率低落。
当一个哨兵判断主库为主观下线后就会向其它哨兵发起协商,其它哨兵就会根据自身与主库的网络状况,做出赞成或拒绝投票的响应。
而只有大多数哨兵实例判断主库都已经"主观下线",主库才会被标记"客观下线",——— 即少数服从多数机制


当这个哨兵的附和票数达到哨兵配置文件中的 quorum 配置项设定的值后,这时主节点就会被该哨兵标记为客观下线。
"客观下线":N个哨兵实例,最好要有N/2+1个实例判断主库为"主观下线",才能判断为"客观下线"。
由哪个哨兵进行主从故障转移

为了淘汰误判概率,所以哨兵是以哨兵集群的方式存在的,以少数服从多数的机制来判断主库是否真的挂了。
那么既然是集群,由哨兵集群中的哪个节点进行主从故障转移呢?
所以这时候,还必要在哨兵集群中选出一个 leader,让 leader 来执行主从切换。
leader是从候选者中产生的,哪个哨兵节点判断主节点为 客观下线 ,这个哨兵节点就是leader的候选者。
假设有三个哨兵。当哨兵 B 先判断到主节点主观下线后,就会给其他实例发送 is-master-down-by-addr 下令。接着,其他哨兵会根据本身和主节点的网络连接环境,做出赞成投票大概拒绝投票的响应。当哨兵 B 收到赞成票数达到哨兵配置文件中的 quorum 配置项设定的值后,就会将主节点标记为 客观下线,此时的哨兵 B 就是一个Leader 的候选者。
判断主库客观下线后只是Leader 的候选者,还不是Leader
由于quorum 配置问题,有可能判断主库客观下线的哨兵有多个。比如有3个哨兵,quorum为2,AB都认为主库主观下线,C认为主库还在线,因此此时哨兵A收到主观下线的值为2,另一个哨兵B收到的主观下线值也为2,由于这两个值都大于等于quorum,因此哨兵A和哨兵B都会将主库标记为客观下线。但不能让哨兵A和哨兵B同时执行主从切换。因此必要从哨兵A和哨兵B中选出一个Leader来执行主从切换
此时Leader候选者会向其他哨兵发送死令,表明盼望成为 Leader 来执行主从切换,并让全部其他哨兵对它进行投票。
每个哨兵只有一次投票机会,假如用完后就不能到场投票了,可以投给本身或投给别人,但是只有Leader候选者才能把票投给本身。
那么只要 Leader候选者 同时满足以下两个条件,就可以成为Leader:

  • 拿到半数以上的赞成票
  • 拿到的票数还要大于等于哨兵配置文件中的 quorum 值。
也就是说,选举的票数大于等于num(sentinel)/2+1时,Leader候选者 将成为 Leader,假如没有高出继续选举
所以,quorum 的值发起设置为哨兵个数的二分之一加1,例如 3 个哨兵就设置 2,5 个哨兵设置为 3,而且哨兵节点的数量应该是奇数
哨兵判断主节点客观下线后,哨兵就要开始在从节点中选出一个从节点来做新主节点
这里大家是不是和我一样有个迷惑?假如三个哨兵同时判断为主观下线,那么就有可能同时判断为客观下线,那么就都是leader候选者了,那么在投票时也都投给了本身,那么leader不就永远选不出来了吗?
首先,哨兵对主从库进行的在线状态检查的操作,是属于一种时间事件,用一个定时器来完成,一般来说每100ms执行一次这些事件。实际上每个哨兵的定时器执行周期都会加上一个小小的随机时间偏移,目标是让每个哨兵执行上述操作的时间能稍微错开些,也是为了避免它们都同时判定主库主观下线。
其次,实际上差别哨兵的网络环境、系统的压力一般不完全一样,接收到主观下线协商消息的时间也就可能差别,所以,它们同时做出主库客观下线判定的概率较小,一般也就有个先后关系。
最后,即使出现了都投给本身一票的环境,导致无法选出Leader,哨兵会停一段时间(一般是故障转移超时时间failover_timeout的2倍),然后再可以进行下一轮投票。
选定新主库

选定新主库是 筛选 ➕ 打分的过程

筛选条件:

首先要把网络状态欠好的从节点给过滤掉。首先把已经下线的从节点过滤掉,然后把以往网络连接状态欠好的从节点也给过滤掉。

  • 检查从库的当前在线状态,判断他之前的网络连接状态
  • 假如从库总是和主库断连,断连次数高出一定阈值,该从库网络状态欠好。
判断方式:
利用配置项down-after-milliseconds*10。down-after-milliseconds是主从节点断连的最大连接超时时间。假如在 down-after-milliseconds 毫秒内,主从节点都没有通过网络接洽上,我们就可以认为主从节点断连了。假如这个断连次数高出10次,说明从库网络状态欠好,不适合作为新主库。
打分:

优先级、复制进度、ID 号

  • 第一轮:优先级最高的从节点胜出
    通过配置slave-priority配置项,给差别从库设置差别优先级。比如两个从库内存巨细不一样,可以手动设置内存大的实例设置为一个高优先级。选主时候哨兵会选出优先级最高的打高分作为新主库,假如得分一样,那就开始第二轮打分。
  • 第二轮:和旧主库同步程度最靠近的从库得分高
    假如选择与旧主库同步最靠近的从库作为主库,那么新主库上就有最新的数据。假如两个从库的slave_repl_offset值巨细一样,那么就必要进入第三轮打分了
怎样判断从库和旧主库间的同步进度?
从库的slave_repl_offset最靠近旧主库的master_repl_offset,那么它的得分最高,可以作为新主库。

  • 第三轮:ID 号小的从节点胜出
    每个从节点都有一个编号,这个编号就是 ID 号,是用来唯一标识从节点的。

通知

将选举出的从节点解除从节点身份,升级为主节点

在选举出从节点为新主节点后后,哨兵 leader 向被选中的从节点发送 SLAVEOF no one 下令,让这个从节点解除从节点的身份,将其变为新主节点。

将从节点指向新的主节点

哨兵 leader 下一步要做的就是,让已下线主节点属下的全部从节点指向新主节点,这一动作可以通过向从节点发送 SLAVEOF 下令来实现。

通知客户端主节点已经更换

这主要通过 Redis 的发布者/订阅者机制来实现的。每个哨兵节点提供发布者/订阅者机制,客户端可以从哨兵订阅消息。
哨兵提供的消息订阅频道有很多,差别频道包含了主从节点切换过程中的差别关键事件,几个常见的事件如下:

客户端和哨兵创建连接后,客户端会订阅哨兵提供的频道。主从切换完成后,哨兵就会向 +switch-master 频道发布新主节点的 IP 地址和端口的消息,这个时候客户端就可以收到这条信息,然后用这内里的新主节点的 IP 地址和端口进行通讯了
将原主节点变为从节点,指向新的主节点

继续监视旧主节点,当旧主节点重新上线时,哨兵集群就会向它发送 SLAVEOF 下令,让它成为新主节点的从节点

频仍主从切换

由于redis是单线程运行的,假如有下令高出3秒,哨兵心跳检查就会失败,最终导致频仍切换主从和脑裂环境
总结

本文首先介绍了哨兵的作用:监控、选主、通知;主要是实现主从节点故障转移。哨兵集群会监测主节点是否存活,假如发现主节点挂了,它就会选举一个从节点切换为主节点,并且把新主节点的相关信息通知给从节点和客户端。
哨兵机制具体步调如下:

  • 第一轮投票:判断主节点客观下线
  • 第二轮投票:选出哨兵leader,决定由哪个哨兵执行主从切换
  • 由哨兵 leader 进行选主
  • 由哨兵 leader 进行通知,实现主从故障转移
在主从复制的基础上,哨兵引入了主节点的自动故障转移,进一步提高了Redis的高可用性;但是哨兵的缺陷同样很明显:哨兵无法对从节点进行自动故障转移,在读写分离场景下,从节点故障会导致读服务不可用,这就必要对从节点做额外的监控、切换操作。 此外,哨兵仍然没有办理写操作无法负载均衡、存储本领受到单机限制的问题;这些问题的办理必要利用集群,有时间再学习集群方面的知识~
面试题专栏

Java面试题专栏已上线,欢迎访问。

  • 假如你不知道简历怎么写,简历项目不知道怎么包装;
  • 假如简历中有些内容你不知道该不该写上去;
  • 假如有些综合性问题你不知道怎么答;
那么可以私信我,我会尽我所能资助你。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

魏晓东

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表