【Redis十二】Redis的典型应用(缓存和分布式锁)

嚴華  论坛元老 | 2024-10-27 21:19:57 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1731|帖子 1731|积分 5193

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
目次
Redis作为缓存
1.什么是缓存?
2.缓存的更新策略
3.缓存预热,缓存穿透,缓存雪崩和缓存击穿
Redis作为分布式锁
1.什么是分布式锁?
2.分布式锁的实现过程


           Redis是现在后端开发中非常热门的组件之一,本篇文章紧张先容它在作为缓存以及分布式领域的作用。
  Redis作为缓存

1.什么是缓存?

   缓存 (cache) 是盘算机中的⼀个经典的概念. 在许多场景中都会涉及到。    核⼼思路就是把⼀些常⽤的数据放到触⼿可及(访问速度更快)的地⽅, ⽅便随时读取。       对于盘算机硬件来说, 每每访问速度越快的设备, 成本越⾼, 存储空间越⼩.        缓存是更快, 但是空间上每每是不⾜的. 因此⼤部分的时候, 缓存只放⼀些 热点数据 (访问频繁的数据),就⾮常有⽤了。         众所周知,咱们日常利用的关系型数据库比如MySQL是非常“娇嫩”的,操作他比起操作缓存是非常耗时的,而且很容易在一瞬间遭受到大量数据操作时,因忙不外来而宕机,数据库许多时候直接成为了整个程序的性能瓶颈。为了给MySQL减少压力,提高程序的效率和稳固性,业内通常利用Redis作为MySQL的缓存,这样就能大大减少MySQL的压力,提高程序性能和稳固性。                   之所以缓存只存热点数据就能大大降低数据库的访问压力,是因为这个天下存在广泛的“二八定律“,即    20% 的热点数据, 能够应对 80% 的访问场景。    因此只需要把这少量的热点数据缓存起来, 就可以应对⼤多数场景, 从⽽在整体上有明显的性    能提拔.        2.缓存的更新策略

   接下来还有⼀个紧张的题目, 到底哪些数据才是 "热点数据" 呢?    对于热点数据的挑选一般有两种方式:  

  • 定期天生
  • 实时天生
   定期天生:               每隔⼀定的周期(⽐如⼀天/⼀周/⼀个⽉), 对于访问的数据频次进⾏统计. 挑选出访问频次最⾼的前 N%的数据。                以搜索引擎为例:
           搜索引擎的服务器会把哪个⽤⼾什么时间搜了啥词, 都通过⽇志的⽅式记载的明明⽩ . 然后                 每隔⼀段时间对这期间的搜索结果进⾏统计 (⽇志的数量大概⾮常巨⼤, 这个统计的过程大概                 需要利用 hadoop等大数据挖掘技术完成). 从⽽就可以得到 "⾼频词表" 。                  实时天生:       先给缓存设定容量上限(可以通过 Redis 配置⽂件的    maxmemory    参数设定).        接下来把⽤⼾每次查询:     

  • 如果在 Redis 查到了, 就直接返回.
  • 如果 Redis 中不存在, 就从数据库查, 把查到的结果同时也写⼊ Redis.
     如果缓存已经满了(到达上限), 就触发缓存淘汰策略, 把⼀些 "相对不那么热⻔" 的数据淘汰掉.        按照上述过程, 持续⼀段时间之后 Redis内部的数据⾃然就是 "热⻔数据" 了。         常用的缓存淘汰策略紧张有以下几种:      

  • FIFO (First In First Out) 先辈先出 :把缓存中存在时间最久的 (也就是先来的数据) 淘汰掉.
  • LRU (Least Recently Used) 淘汰最久未使⽤的 :记载每个 key 的近来访问时间. 把近来访问时间最⽼的 key 淘汰掉.
  • LFU (Least Frequently Used) 淘汰访问次数最少的 :记载每个 key 近来⼀段时间的访问次数. 把访问次数最少的淘汰掉.
  • Random 随机淘汰 :从所有的 key 中抽取荣幸⼉被随机淘汰掉
    3.缓存预热,缓存穿透,缓存雪崩和缓存击穿

缓存预热
   什么是缓存预热?              使⽤ Redis 作为 MySQL 的缓存的时候, 当 Redis 刚刚启动, 大概 Redis ⼤批 key 失效之后, 此时由于Redis ⾃⾝相当于是空着的, 没啥缓存数据, 那么 MySQL 就大概直接被访问到, 从⽽造成较⼤的压⼒.因此就需要提前把热点数据预备好, 直接写⼊到 Redis 中. 使 Redis 可以尽快为 MySQL 撑起掩护伞.热点数据可以基于之前先容的统计的⽅式⽣成即可. 这份热点数据不⼀定⾮得那么 "准确", 只要能帮助MySQL 抵挡⼤部分请求即可. 随着程序运⾏的推移, 缓存的热点数据会渐渐⾃动调解, 来更适应当前环境。    缓存穿透
   什么是缓存穿透?               访问的 key 在 Redis 和 数据库中都不存在. 此时这样的 key 不会被放到缓存上, 后续如果仍旧在访问该key, 依然会访问到数据库. 这就会导致数据库负担的请求太多, 压⼒很⼤. 这种环境称为 缓存穿透.     因为什么产生?
   

  • 业务设计不合理. ⽐如缺少必要的参数校验环节, 导致⾮法的 key 也被进⾏查询了.
  • 开发/运维误操作. 不⼩⼼把部分数据从数据库上误删了.
  • ⿊客恶意攻击.
  怎样办理? 
   

  • 针对要查询的参数进⾏严格的合法性校验. ⽐如要查询的 key 是⽤⼾的⼿机号, 那么就需要校验当前key 是否满⾜⼀个合法的⼿机号的格式.
  • 针对数据库上也不存在的 key , 也存储到 Redis 中, ⽐如 value 就任意设成⼀个 "". 避免后续频繁访问数据库.
  • 使⽤布隆过滤器先判定 key 是否存在, 再真正查询.
  缓存雪崩
   什么是缓存雪崩?       短时间内⼤量的 key 在缓存上失效, 导致数据库压⼒骤增, 甚⾄直接宕机。      为何产⽣?        ⼤规模 key 失效, 大概性紧张有两种:     

  • Redis 挂了.
  • Redis 上的⼤量的 key 同时过期.
   怎样办理?

   

  • 摆设⾼可⽤的 Redis 集群, 并且完善监控报警体系.
  • 不给 key 设置过期时间 大概 设置过期时间的时候添加随机时间因⼦.
  缓存击穿
   什么是缓存击穿?                   相当于缓存雪崩的特别环境. 针对热点 key , 突然过期了, 导致⼤量的请求直接访问到数据库上, 甚⾄引起数据库宕机.         怎样办理?
   

  • 基于统计的⽅式发现热点 key, 并设置永不外期.
  • 进⾏必要的服务降级. 比方访问数据库的时候使⽤分布式锁, 限定同时请求数据库的并发数.
  Redis作为分布式锁

1.什么是分布式锁?

   在⼀个分布式的系统中, 也会涉及到多个节点访问同⼀个公共资源的环境. 此时就需要通过 锁 来做互斥控制, 避免出现类似于 "线程安全" 的题目.     ⽽ java 的 synchronized 大概 C++ 的 std::mutex, 这样的锁都是只能在当前进程中⽣效, 在分布式的这种多个进程多个主机的场景下就⽆能为力了。                  分布式锁本质上就是使⽤⼀个公共的服务器, 来记载 加锁状态。这个公共的服务器可以是 Redis, 也可以是其他组件(⽐如 MySQL 大概 ZooKeeper 等), 还可以是我们⾃⼰写的⼀个服务。       2.分布式锁的实现过程

1.首先我们可以利用Redis的键值对功能进行简单的加锁功能。
             如果服务器1 尝试买票操作, 就需要先访问 Redis, 在 Redis 上设置⼀个键值对. ⽐如 key 就是⻋   次, value 任意设置个值 (比如 1).如果这个操作设置乐成, 就视为当前没有节点对该 001 ⻋次加锁, 就可以进⾏数据库的读写操作. 操作完成之后, 再把 Redis 上刚才的这个键值对给删除掉. 如果在 买票服务器1 操作数据库的过程中, 买票服务器2 也想买票, 也会尝试给 Redis 上写⼀个键值对, key 同样是⻋次. 但是此时设置的时候发现该⻋次的 key 已经存在了, 则认为已经有其他服务器正在持有锁, 此时服务器2就需要等候大概临时放弃.(可以利用setnx操作)。    2.在上述加锁过程中我们可以引入过期时间。
          当服务器1 加锁之后, 开始处理买票的过程中, 如果 服务器1 不测宕机了, 就会导致解锁操作 (删除该key) 不能执⾏. 就大概引起其他服务器始终⽆法获取到锁的环境. 为相识决这个题目, 可以在设置 key 的同时引⼊过期时间. 即这个锁最多持有多久, 就应该被开释。
  3. 对于Redis写入的加锁键值对,其他节点也是可以删除的,此时我们需要引入校验id。
      ⽐如 服务器1 写⼊⼀个 "001": 1 这样的键值对, 服务器2 是完全可以把 "001" 给删除掉的. 当然, 服务器2 不会进⾏这样的 "恶意删除" 操作, 不外不能保证因为⼀些 bug 导致 服务器2 把锁误删除。           为相识决上述题目, 我们可以引⼊⼀个校验 id.           ⽐如可以把设置的键值对的值, 不再是简单的设为⼀个 1, ⽽是设成服务器的编号. 形如 "001": "服务器 1"。这样就可以在删除 key (解锁)的时候, 先校验当前删除 key 的服务器是否是当初加锁的服务器, 如果是,才能真正删除; 不是, 则不能删除。       4.引入Redis的Lua脚本功能是锁操作具有原子性。 
           lua脚本是一个以.lua为后缀的文件,利用lua语法编辑,它可以由redis-cli或jedis等客户端加载,并发送给Redis服务器,由Redis服务器来执行这段逻辑。一个lua脚本会被Redis以原子的方式来执行
  5.引入watch dog(看门狗)使过期时间更准确。
          上述⽅案仍旧存在⼀个紧张题目. 当我们设置了 key 过期时间之后 (⽐如 10s), 仍旧存在⼀定的大概性, 当使命还没执⾏完, key 就先过期了. 这就导致锁提前失效。所谓 watch dog, 本质上是加锁的服务器上的⼀个单独的线程, 通过这个线程来对锁过期时间进⾏ "续约"。这样就不担⼼锁提前失效的题目了. ⽽且另⼀⽅⾯, 如果该服务器挂了, 看⻔狗线程也就随之挂了, 此时无人续约, 这个 key ⾃然就可以敏捷过期, 让其他服务器能够获取到锁了.
  6.引入Redlock算法,利用Redis集群到场分布式锁。
      实践中的 Redis ⼀般是以集群的⽅式摆设的 (⾄少是主从的形式, ⽽不是单机). 那么就大概出现以下⽐较极端的⼤冤种环境:      
       服务器1 向 master 节点进⾏加锁操作. 这个写⼊ key 的过程刚刚完成, master 挂了; slave 节点升级成了新的 master 节点. 但是由于刚才写⼊的这个 key 尚将来得及同步给 slave 呢, 此时就相当于 服务器1 的加锁操作形同虚设了, 服务器2 仍旧可以进⾏加锁 (即给新的 master 写⼊ key. 因为新的 master 不包罗刚才的 key).            为相识决这个题目, Redis 的作者提出了 Redlock 算法.        我们引⼊⼀组 Redis 节点. 其中每⼀组 Redis 节点都包罗⼀个主节点和若⼲从节点. 并且组和组之间存储的数据都是⼀致的, 相互之间是 "备份" 关系(⽽并⾮是数据集合的⼀部分, 这点有别于 Redis cluster).加锁的时候, 按照⼀定的顺序, 写多个 master 节点. 在写锁的时候需要设定操作的 "超时时间". ⽐如50ms. 即如果 setnx 操作超过了 50ms 还没有乐成, 就视为加锁失败.如果给某个节点加锁失败, 就⽴即再尝试下⼀个节点. 当加锁乐成的节点数超过总节点数的⼀半, 才视为加锁乐成. 这样的话, 即使有某些节点挂了, 也不影响锁的正确性.同理, 开释锁的时候, 也需要把所有节点都进⾏解锁操作. (即使是之前超时的节点, 也要尝试解锁, 只管保证逻辑严密)。
     Redlock 算法的核⼼就是, 加锁操作不能只写给⼀个 Redis 节点, ⽽要写个多个!! 分布式系统中任何⼀个节点都是不可靠的. 最终的加锁乐成结论是 "少数服从多数的"。
   由于⼀个分布式系统不⾄于⼤部分节点都同时出现故障, 因此这样的可靠性要⽐单个节点来说靠谱不少.     ❤️
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

嚴華

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表