【高可用】keepalived的试用与学习笔记

打印 上一主题 下一主题

主题 840|帖子 840|积分 2520

版本日期修订人形貌V1.02025/2/23nick huang创建文档 配景

最近,预研给现有的Nginx单点实例添加故障转移的功能,以备单实例故障时无法快速恢复。
本文记录Keepalived的学习笔记,供自己或同砚日后参考。
Keepalived

Keepalived是一个开源的高可用性解决方法,主要用于在Linux中实现服务的故障检测、自动故障转移和负载均衡。
   Tips
从他的名称就能了解他的作用:keep alived —— 保持活跃
    Tips
高可用(High Availability,HA),是指通过计划和技术手段,使系统或服务在面临硬件故障、网络故障、软件故障等潜在风险时,仍能连续稳定地提供服务的能力。
高可用不是单一的技术,而是架构计划、工程实现等的综合实现。
Keepalived是构建高可用集群的工具之一,通过VRRP协媾和健康查抄机制,简化服务冗余的实现。
  VRRP协议(虚拟路由冗余协议)

Keepalived是基于VRRP协议的实现工具。VRRP协议界说了主备节点和故障切换的标准流程。
VRRP的配景:
在VRRP出现之前,局域网依赖单一物理设备作为默认网关,这种计划存在单点故障风险。
在90年代,IETF开始制定统一的网关冗余标准,通过VRRP解决上述问题。
VRRP作用:允许多台网关冗余协同工作,通过故障检测和切换手段在秒级通过虚拟IP完成切换,主机难以感知到网关变革。
安装

笔者使用的时CentOS,方便起见,用的是yum安装。
  1. ## yum命令
  2. yum -y install keepalived
  3. ## 查看安装后的路径和文件
  4. # rpm -ql keepalived
复制代码
简单的HelloWorld场景运行一下

1、我们先搭建好Nginx,Nginx的过程省略。
现在以下地点,应该能访问Nginx的默认静态资源:%nginx_hone%/html/index.html
  1. http://服务器1的IP
复制代码
2、备份好主可配置文件
Keepalived的主配置文件为:/etc/keepalived/keepalived.conf
我们后面需要修改此文件,修改前备份一下呗:
  1. cp /etc/keepalived/keepalived.conf  /etc/keepalived/keepalived.conf.bak.origin
复制代码
3、编辑主配置文件
  1. vi /etc/keepalived/keepalived.conf
复制代码
配置文件内容,实际可以了解各配置的作用并做调解或增删:
  1. ! Configuration File for keepalived
  2. global_defs {
  3.    router_id NGINX_HA
  4.    vrrp_skip_check_adv_addr
  5.    vrrp_strict
  6.    vrrp_garp_interval 0
  7.    vrrp_gna_interval 0
  8. }
  9. vrrp_instance VI_1 {
  10.     state MASTER
  11.     interface enp0s3
  12.     virtual_router_id 66
  13.     priority 100
  14.     advert_int 1
  15.     authentication {
  16.         auth_type PASS
  17.         auth_pass 你的密码
  18.     }
  19.     virtual_ipaddress {
  20.         你的虚拟IP
  21.     }
  22. }
复制代码
对于上述的配置的作用,做了一些简单地整理:
  1. global_defs { # 全局定义
  2.    notification_email { # 收到通知邮件
  3.      xxxxxx@xxxxxx.xxx
  4.    }
  5.    notification_email_from xxxxxx@xxxxxx.xxx # 发件人
  6.    smtp_server xxx.xxx.xxx.xxx # 发送邮件所使用的SMTP服务器地址
  7.    smtp_connect_timeout 30 # 发送邮件连接超时时间
  8.    router_id LVS_DEVEL # Keepalived的路由ID,在VRRP通信中用于标识不同的Keepalived实例
  9.    vrrp_skip_check_adv_addr # 是否跳过VRRP广告报文中的源地址是否与上一个报文相同,启用则写入此配置项,无需赋值
  10.    vrrp_strict # 是否严格遵守VRRP协议的规定
  11.    vrrp_garp_interval 0 # 在VRRP环境中,当Master设备出现故障并切换到Backup时,Backup设备会发送Gratuitous ARP消息,以通知网络中的其他设备更新其ARP缓存,确保数据包能够正确地发送到新的Master设备。vrrp_garp_interval用于控制Gratuitous ARP消息的发送频率(实际上是发送延迟,延迟越短,频率越高)
  12.    vrrp_gna_interval 0 # 在VRRP环境中,邻居通告消息用于在VRRP路由器之间传递状态信息,以确保它们之间的同步和协调,这些消息包括路由器的优先级、虚拟IP地址等信息,对于VRRP协议的正常运作至关重要,此配置用于配置此消息的发送延迟时间
  13. }
  14. # 虚拟路由器实例配置
  15. vrrp_instance VI_1 {
  16.     state MASTER # 虚拟路由器实例的状态:MASTER为主路由器,BACKUP为备份路由器
  17.     interface eth0 # 实例要绑定的物理接口(通常是一个真实网络接口)
  18.     virtual_router_id 51 # 虚拟路由器标识符,用于唯一标识一个VRRP备份组,确保同一个局域网内,不同的VRRP备份组之间不会互相干扰
  19.     priority 100 # 优先级,用于决定哪个路由器实例将成为VRRP备份组中的主路由器
  20.     advert_int 1 # 通告间隔,用于指定VRRP路由器实例发送VRRP通告报文的时间间隔,这个参数对VRRP备份组的稳定性和故障转移速度有重要影响,默认1秒
  21.     authentication { # 认证,用于确保VRRP备份组内的路由器实例之间的通信安全。通过配置认证,可以防止未经授权的路由器实例加入VRRP备份组,从而保护网络的稳定性和安全性
  22.         auth_type PASS # 认证类型
  23.         auth_pass xxxxxx # 认证密码
  24.     }
  25.     virtual_ipaddress { # 用于指定一个或多个虚拟IP地址,这些虚拟IP地址不属于任何物理接口,而是被分配给VRRP虚拟路由实例。当VRRP组的主路由器选举完成后,主路由器将接管这些虚拟IP地址,并对外提供服务。
  26.         你的VIP IP 1
  27.         你的VIP IP 2
  28.         你的VIP IP 3
  29.     }
  30.     track_script { # 用于关联之前定义的vrrp_script监控脚本
  31.    
  32.     }
  33. }
复制代码
4、启动
在启动前,你可以使用ip a查询并记录一下网络信息。
启动后由于加入虚拟IP的特性,网络信息会加入虚拟IP的变革。
启动命令:
  1. systemctl start keepalived.service
复制代码
5、验证效果
你可以从这几个角度查抄下是否启动:
  1. 1)查看进程
  2. ps -ef | grep keep
  3. 2)查看系统日志的Keepalived相关日志
  4. less /var/log/messages
  5. 3)查看网络信息中是否存在配置的虚拟IP
  6. ip a
复制代码
如果顺遂,你应该可以通过虚拟IP访问Nginx的资源:
  1. http://虚拟IP/
复制代码
两个Nginx副本,Keepalived做故障转移

1、在另一台服务器再搭建一个Nginx实例,搭建过程省略。
2、添加检测Nginx进程是否存活的脚本,并添加实行权限
  1. vi /opt/keepalived/shell/monitor_nginx.sh
复制代码
脚本内容:
   Tips
本脚本仅做本次测试使用,实际使用可以写得更严谨、健壮些。
  后话:经过简单地压测,此脚本在主服务器的Nginx宕机后,二次启动时,会有几秒的制止。
由于此脚本的判断点是“是否有Nginx的进程”,而Nginx在“启动进程”到“真正能接受哀求”,可能照旧有时间差的,这不敷严谨,所以造成几秒的制止。
  1. #!/bin/bash
  2. nginx_ps_num=`ps -C nginx --no-header | wc -l`
  3. if [ $nginx_ps_num == 0 ]; then
  4.     exit 1
  5. fi
  6. exit 0
复制代码
可以看到上述脚本有两种返回:
1)返回0,体现监控的服务正常运行,不会触发故障转移
2)返回1,体现监控的服务非常,可能触发故障转移(取决于失败次数和其他配置)
3、在服务器1配置主配置文件
  1. vi /etc/keepalived/keepalived.conf
复制代码
配置内容参考,实际可以了解各配置的作用并做调解或增删:
  1. ! Configuration File for keepalived
  2. global_defs {
  3.    router_id NGINX_HA
  4.    vrrp_skip_check_adv_addr
  5.    vrrp_strict
  6.    vrrp_garp_interval 0
  7.    vrrp_gna_interval 0
  8. }
  9. vrrp_script monitor_nginx_script {
  10.    script "/opt/keepalived/shell/monitor_nginx.sh"
  11.    interval 1
  12.    weight 10
  13.    fall 1
  14.    rise 3
  15. }
  16. vrrp_instance VI_21 {
  17.     state MASTER
  18.     interface enp0s3
  19.     virtual_router_id 66
  20.     priority 55
  21.     advert_int 1
  22.     authentication {
  23.         auth_type PASS
  24.         auth_pass 你的密码
  25.     }
  26.     virtual_ipaddress {
  27.         你的虚拟IP
  28.     }
  29.     track_script {
  30.         monitor_nginx_script
  31.     }
  32. }
复制代码
对于上述的新增配置的作用,做了一些简单地整理:
  1. vrrp_script monitor_xxxxx_script { # 定义脚本来监控某些条件或服务的状态,这些脚本通常用于检测后端服务的健康状态
  2.    script "/opt/keepalived/shell/monitor_xxxxx.sh" # 具体要执行的脚本的路径或内容,这个脚本是一个shell命令或可执行程序,它会被Keepalived定期调用以检查某个条件或服务的状态
  3.    interval 1 # 定期执行监控脚本的时间间隔,单位为秒
  4.    weight -20 # 当执行脚本的执行结果触发状态变化时,应该增加或减少VRRP实例的优先级的量值。正数权重,当脚本执行成功时,VRRP实例的优先级会增加相应权重值;负数权重,当脚本执行失败时,VRRP实例的优先级会减少相应的权重值。
  5.    timeout 3 # 脚本超时时间,单位为秒(可选配置)
  6.    fall 2 # 失败次数达到此值时触发状态切换(可选配置)
  7.    rise 2 # 成功次数达到此值时恢复状态(可选配置)
  8. }
复制代码
4、在服务器1配置主配置文件
  1. vi /etc/keepalived/keepalived.conf
复制代码
配置内容参考,实际可以了解各配置的作用并做调解或增删:
  1. ! Configuration File for keepalived
  2. global_defs {
  3.    router_id NGINX_HA
  4.    vrrp_skip_check_adv_addr
  5.    vrrp_strict
  6.    vrrp_garp_interval 0
  7.    vrrp_gna_interval 0
  8. }
  9. vrrp_script monitor_nginx_script {
  10.    script "/opt/keepalived/shell/monitor_nginx.sh"
  11.    interval 1
  12.    weight 10
  13.    fall 1
  14.    rise 3
  15. }
  16. vrrp_instance VI_22 {
  17.     state BACKUP
  18.     interface enp0s3
  19.     virtual_router_id 66
  20.     priority 50
  21.     advert_int 1
  22.     authentication {
  23.         auth_type PASS
  24.         auth_pass 你的密码
  25.     }
  26.     virtual_ipaddress {
  27.         你的虚拟IP
  28.     }
  29.     track_script {
  30.         monitor_nginx_script
  31.     }
  32. }
复制代码
5、启动及验证
在启动前,你可以使用ip a查询并记录一下网络信息。
启动后由于加入虚拟IP的特性,网络信息会加入虚拟IP的变革。
启动命令:
  1. systemctl start keepalived.service
复制代码
两台服务器均启动成功后,你可以发现其中一台服务器的网络信息上有虚拟IP的信息,那台就是主服务器。
你访问以下地点,实际访问的是主服务器的资源。
http://虚拟IP/

   Tips
由于使用Nginx的默认静态资源作访问测试。
可以将两台Nginx服务器的默认静态资源稍作修改(添加标识),使得我们用欣赏器访问时可以或许辨认其时访问的是哪台机器。
具体如何修改呢?
编辑此文件:%nginx_hone%/html/index.html,在内容中添加你可辨别的体现即可。
  此时,我们可以测试故障转移的场景:
关闭主服务器的Nginx进程,再访问以下地点。如果顺遂的话,你应该可以访问成功,此时实际访问的是另一台服务器的资源了:
http://虚拟IP/

   Tips
如果发现故障转移不成功,或发现两台服务器的网络信息中均包含虚拟IP信息。
可以查抄下服务器的防火墙是否克制了相关的网络行为。
  最后

小弟不才,学识有限,如有错漏,欢迎指正哈。
如果本文对你有帮助,记得“一键三连”(“点赞”、“评论”、“收藏”)哦!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

小小小幸运

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表