版本日期修订人形貌V1.02025/2/23nick huang创建文档 配景
最近,预研给现有的Nginx单点实例添加故障转移的功能,以备单实例故障时无法快速恢复。
本文记录Keepalived的学习笔记,供自己或同砚日后参考。
Keepalived
Keepalived是一个开源的高可用性解决方法,主要用于在Linux中实现服务的故障检测、自动故障转移和负载均衡。
Tips
从他的名称就能了解他的作用:keep alived —— 保持活跃
Tips
高可用(High Availability,HA),是指通过计划和技术手段,使系统或服务在面临硬件故障、网络故障、软件故障等潜在风险时,仍能连续稳定地提供服务的能力。
高可用不是单一的技术,而是架构计划、工程实现等的综合实现。
Keepalived是构建高可用集群的工具之一,通过VRRP协媾和健康查抄机制,简化服务冗余的实现。
VRRP协议(虚拟路由冗余协议)
Keepalived是基于VRRP协议的实现工具。VRRP协议界说了主备节点和故障切换的标准流程。
VRRP的配景:
在VRRP出现之前,局域网依赖单一物理设备作为默认网关,这种计划存在单点故障风险。
在90年代,IETF开始制定统一的网关冗余标准,通过VRRP解决上述问题。
VRRP作用:允许多台网关冗余协同工作,通过故障检测和切换手段在秒级通过虚拟IP完成切换,主机难以感知到网关变革。
安装
笔者使用的时CentOS,方便起见,用的是yum安装。
- ## yum命令
- yum -y install keepalived
- ## 查看安装后的路径和文件
- # rpm -ql keepalived
复制代码 简单的HelloWorld场景运行一下
1、我们先搭建好Nginx,Nginx的过程省略。
现在以下地点,应该能访问Nginx的默认静态资源:%nginx_hone%/html/index.html
2、备份好主可配置文件
Keepalived的主配置文件为:/etc/keepalived/keepalived.conf
我们后面需要修改此文件,修改前备份一下呗:
- cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak.origin
复制代码 3、编辑主配置文件
- vi /etc/keepalived/keepalived.conf
复制代码 配置文件内容,实际可以了解各配置的作用并做调解或增删:
- ! Configuration File for keepalived
- global_defs {
- router_id NGINX_HA
- vrrp_skip_check_adv_addr
- vrrp_strict
- vrrp_garp_interval 0
- vrrp_gna_interval 0
- }
- vrrp_instance VI_1 {
- state MASTER
- interface enp0s3
- virtual_router_id 66
- priority 100
- advert_int 1
- authentication {
- auth_type PASS
- auth_pass 你的密码
- }
- virtual_ipaddress {
- 你的虚拟IP
- }
- }
复制代码 对于上述的配置的作用,做了一些简单地整理:
- global_defs { # 全局定义
- notification_email { # 收到通知邮件
- xxxxxx@xxxxxx.xxx
- }
- notification_email_from xxxxxx@xxxxxx.xxx # 发件人
- smtp_server xxx.xxx.xxx.xxx # 发送邮件所使用的SMTP服务器地址
- smtp_connect_timeout 30 # 发送邮件连接超时时间
- router_id LVS_DEVEL # Keepalived的路由ID,在VRRP通信中用于标识不同的Keepalived实例
- vrrp_skip_check_adv_addr # 是否跳过VRRP广告报文中的源地址是否与上一个报文相同,启用则写入此配置项,无需赋值
- vrrp_strict # 是否严格遵守VRRP协议的规定
- vrrp_garp_interval 0 # 在VRRP环境中,当Master设备出现故障并切换到Backup时,Backup设备会发送Gratuitous ARP消息,以通知网络中的其他设备更新其ARP缓存,确保数据包能够正确地发送到新的Master设备。vrrp_garp_interval用于控制Gratuitous ARP消息的发送频率(实际上是发送延迟,延迟越短,频率越高)
- vrrp_gna_interval 0 # 在VRRP环境中,邻居通告消息用于在VRRP路由器之间传递状态信息,以确保它们之间的同步和协调,这些消息包括路由器的优先级、虚拟IP地址等信息,对于VRRP协议的正常运作至关重要,此配置用于配置此消息的发送延迟时间
- }
- # 虚拟路由器实例配置
- vrrp_instance VI_1 {
- state MASTER # 虚拟路由器实例的状态:MASTER为主路由器,BACKUP为备份路由器
- interface eth0 # 实例要绑定的物理接口(通常是一个真实网络接口)
- virtual_router_id 51 # 虚拟路由器标识符,用于唯一标识一个VRRP备份组,确保同一个局域网内,不同的VRRP备份组之间不会互相干扰
- priority 100 # 优先级,用于决定哪个路由器实例将成为VRRP备份组中的主路由器
- advert_int 1 # 通告间隔,用于指定VRRP路由器实例发送VRRP通告报文的时间间隔,这个参数对VRRP备份组的稳定性和故障转移速度有重要影响,默认1秒
- authentication { # 认证,用于确保VRRP备份组内的路由器实例之间的通信安全。通过配置认证,可以防止未经授权的路由器实例加入VRRP备份组,从而保护网络的稳定性和安全性
- auth_type PASS # 认证类型
- auth_pass xxxxxx # 认证密码
- }
- virtual_ipaddress { # 用于指定一个或多个虚拟IP地址,这些虚拟IP地址不属于任何物理接口,而是被分配给VRRP虚拟路由实例。当VRRP组的主路由器选举完成后,主路由器将接管这些虚拟IP地址,并对外提供服务。
- 你的VIP IP 1
- 你的VIP IP 2
- 你的VIP IP 3
- }
- track_script { # 用于关联之前定义的vrrp_script监控脚本
-
- }
- }
复制代码 4、启动
在启动前,你可以使用ip a查询并记录一下网络信息。
启动后由于加入虚拟IP的特性,网络信息会加入虚拟IP的变革。
启动命令:
- systemctl start keepalived.service
复制代码 5、验证效果
你可以从这几个角度查抄下是否启动:
- 1)查看进程
- ps -ef | grep keep
- 2)查看系统日志的Keepalived相关日志
- less /var/log/messages
- 3)查看网络信息中是否存在配置的虚拟IP
- ip a
复制代码 如果顺遂,你应该可以通过虚拟IP访问Nginx的资源:
两个Nginx副本,Keepalived做故障转移
1、在另一台服务器再搭建一个Nginx实例,搭建过程省略。
2、添加检测Nginx进程是否存活的脚本,并添加实行权限
- vi /opt/keepalived/shell/monitor_nginx.sh
复制代码 脚本内容:
Tips
本脚本仅做本次测试使用,实际使用可以写得更严谨、健壮些。
后话:经过简单地压测,此脚本在主服务器的Nginx宕机后,二次启动时,会有几秒的制止。
由于此脚本的判断点是“是否有Nginx的进程”,而Nginx在“启动进程”到“真正能接受哀求”,可能照旧有时间差的,这不敷严谨,所以造成几秒的制止。
- #!/bin/bash
- nginx_ps_num=`ps -C nginx --no-header | wc -l`
- if [ $nginx_ps_num == 0 ]; then
- exit 1
- fi
- exit 0
复制代码 可以看到上述脚本有两种返回:
1)返回0,体现监控的服务正常运行,不会触发故障转移
2)返回1,体现监控的服务非常,可能触发故障转移(取决于失败次数和其他配置)
3、在服务器1配置主配置文件
- vi /etc/keepalived/keepalived.conf
复制代码 配置内容参考,实际可以了解各配置的作用并做调解或增删:
- ! Configuration File for keepalived
- global_defs {
- router_id NGINX_HA
- vrrp_skip_check_adv_addr
- vrrp_strict
- vrrp_garp_interval 0
- vrrp_gna_interval 0
- }
- vrrp_script monitor_nginx_script {
- script "/opt/keepalived/shell/monitor_nginx.sh"
- interval 1
- weight 10
- fall 1
- rise 3
- }
- vrrp_instance VI_21 {
- state MASTER
- interface enp0s3
- virtual_router_id 66
- priority 55
- advert_int 1
- authentication {
- auth_type PASS
- auth_pass 你的密码
- }
- virtual_ipaddress {
- 你的虚拟IP
- }
- track_script {
- monitor_nginx_script
- }
- }
复制代码 对于上述的新增配置的作用,做了一些简单地整理:
- vrrp_script monitor_xxxxx_script { # 定义脚本来监控某些条件或服务的状态,这些脚本通常用于检测后端服务的健康状态
- script "/opt/keepalived/shell/monitor_xxxxx.sh" # 具体要执行的脚本的路径或内容,这个脚本是一个shell命令或可执行程序,它会被Keepalived定期调用以检查某个条件或服务的状态
- interval 1 # 定期执行监控脚本的时间间隔,单位为秒
- weight -20 # 当执行脚本的执行结果触发状态变化时,应该增加或减少VRRP实例的优先级的量值。正数权重,当脚本执行成功时,VRRP实例的优先级会增加相应权重值;负数权重,当脚本执行失败时,VRRP实例的优先级会减少相应的权重值。
- timeout 3 # 脚本超时时间,单位为秒(可选配置)
- fall 2 # 失败次数达到此值时触发状态切换(可选配置)
- rise 2 # 成功次数达到此值时恢复状态(可选配置)
- }
复制代码 4、在服务器1配置主配置文件
- vi /etc/keepalived/keepalived.conf
复制代码 配置内容参考,实际可以了解各配置的作用并做调解或增删:
- ! Configuration File for keepalived
- global_defs {
- router_id NGINX_HA
- vrrp_skip_check_adv_addr
- vrrp_strict
- vrrp_garp_interval 0
- vrrp_gna_interval 0
- }
- vrrp_script monitor_nginx_script {
- script "/opt/keepalived/shell/monitor_nginx.sh"
- interval 1
- weight 10
- fall 1
- rise 3
- }
- vrrp_instance VI_22 {
- state BACKUP
- interface enp0s3
- virtual_router_id 66
- priority 50
- advert_int 1
- authentication {
- auth_type PASS
- auth_pass 你的密码
- }
- virtual_ipaddress {
- 你的虚拟IP
- }
- track_script {
- monitor_nginx_script
- }
- }
复制代码 5、启动及验证
在启动前,你可以使用ip a查询并记录一下网络信息。
启动后由于加入虚拟IP的特性,网络信息会加入虚拟IP的变革。
启动命令:
- systemctl start keepalived.service
复制代码 两台服务器均启动成功后,你可以发现其中一台服务器的网络信息上有虚拟IP的信息,那台就是主服务器。
你访问以下地点,实际访问的是主服务器的资源。
http://虚拟IP/
Tips
由于使用Nginx的默认静态资源作访问测试。
可以将两台Nginx服务器的默认静态资源稍作修改(添加标识),使得我们用欣赏器访问时可以或许辨认其时访问的是哪台机器。
具体如何修改呢?
编辑此文件:%nginx_hone%/html/index.html,在内容中添加你可辨别的体现即可。
此时,我们可以测试故障转移的场景:
关闭主服务器的Nginx进程,再访问以下地点。如果顺遂的话,你应该可以访问成功,此时实际访问的是另一台服务器的资源了:
http://虚拟IP/
Tips
如果发现故障转移不成功,或发现两台服务器的网络信息中均包含虚拟IP信息。
可以查抄下服务器的防火墙是否克制了相关的网络行为。
最后
小弟不才,学识有限,如有错漏,欢迎指正哈。
如果本文对你有帮助,记得“一键三连”(“点赞”、“评论”、“收藏”)哦!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |