Redis数据结构与类型

打印 上一主题 下一主题

主题 787|帖子 787|积分 2361

目录

Redis 的数据结构

简单动态字符串(SDS)


  • 简单动态字符串(SDS):Redis 自己构建的抽象类型,并作为默认字符串类型使用
  • C 字符串只会作为 Redis 字符串字面量用在一些无需对字符串进行修改的地方,比如打印日志
  • 除了用来生存数据库的字符串外,SDS 还被用作缓冲区(buffer):AOF 模块的 AOF 缓冲区,客户端状态中的输入缓冲区
  • SDS 的优点:

    • 常数复杂度获取字符串长度
    • 杜绝缓冲区溢出
    • 减少修改字符串长度时所需的内存重分配次数
    • 二进制安全
    • 兼容部门 C 字符串函数

SDS 的结构



  • SDS 遵照 C 字符串中以空字符末端的管理,生存空字符串的 1 字节空间不计算在 len 中

    • 好处是,SDS 可以直接复用 C 语言库中的一些函数

SDS 和 C 字符串的区别

  • C 字符串不记录长度,O(n)获取长度,但是 SDS 可以在 O(1)复杂度获取长度
  • C 字符串不记录长度可能会导致缓冲区溢出(buffer overflow),SDS API 需要对 SDS 修改时,会先检查是否满足修改所需的要求,如果不满足,就会自动将 SDS 的空间扩展至执行修改所需的大小

空间扩展计谋

如果类似 C 字符串,每次修改字符串都要进行内存重分配的话,对性能会有很大影响

  • SDS 数组里面可以 包罗未使用的字节,由 free 属性记录
  • 通过未使用空间,SDS 实现了 空间预分配 和 惰性空间开释 两种优化计谋
1. 空间预分配

  • 当 SDS 的 API 对一个 SDS 进行修改的得当,步伐 不仅会为 SDS 分配修改所必须要的空间,还会为 SDS 分配额外的未使用空间
  • 如果 SDS 修改后长度小于 1MB,那么步伐 分配和 len 同样大小的未使用空间(free)
  • 如果修改后大于 1MB,那么步伐会 分配 1MB 的未使用空间
  • 通过预分配计谋,SDS 将连续增长 N 次字符串所需的内存分配次数 从必定 N 次低落为最多 N 次
2. 惰性空间开释

  • 当 SDS 的 API 缩短 SDS 生存的字符串时,步伐不立刻使用内存重分配来回收缩短后多出来的字节,而是用 free 属性记录下来,下次使用
特性


  • 二进制安全:SDS 使用 len 属性的值来记录长度,所以 SDS 可以存储一系列二进制数据(这样就不用担心遇到\0 就结束的问题了)
  • 兼容部门 C 字符串函数:SDS 遵照以空字符串末端的惯例,API 总会将 SDS 生存的数据的末尾置为空字符串,所以可以使用 C 语言的部门函数
SDS API



Redis 链表(list)


  • 链表被广泛用于实现 Redis 的各种功能,比如列表键、发布与订阅、慢查询、监督器等
Redis 链表结构


  • 链表结构体:


  • 链表结点结构体:


  • Redis 链表整体结构:


  • list 结构为链表提供了表头指针 head 和表尾指针 tail,以及链表长度的计数器 len;
  • dup、free、match 成员则用用于实现多态链表所需的类型特定函数(三个回调函数):

    • dup 函数用于复制链表节点所生存的值
    • free 函数用于开释链表节点所生存的值
    • match 函数用于比对链表节点所生存的值和另一个输入值是否相称

特性


  • 双端:链表节点带有 prev 和 next 指针
  • 无环:表头的 prev 指针和表尾的 next 指针都指向 NULL
  • 带表头指针和表尾指针,获取表头表尾复杂度都是 O(1)
  • 带链表长度计数器:获取节点数目标复杂度为 O(1)
  • 多态:链表节点用 void*生存节点值,通过 list 的 dup、free、match 为节点值设置类型特定的函数,所以链表可以生存差异类型的值
链表和链表节点 API



Redis 字典(dict)


  • 字典:又称为符号表、关联数组或映射,是用于生存键值对的数据结构
  • Redis 的数据库就是使用字典来作为底层实现的,对数据库的增删改查都是创建在字典的操作之上的
Redis 字典结构

Redis 字典所使用的哈希表结构:



  • 每个 dictEntry 结构生存着一个键值对
  • size 记录了哈希表的大小,也就是 table 数组的大小
  • used 数据记录了哈希表目前已有节点(键值对)的数目
  • sizemask 属性的值总是即是 size - 1,用于哈希算法干系
哈希表节点


  • key 生存键值对中的键,v 属性生存值:键值对的值可以是一个指针,大概是一个整数(多态)
  • next 属性指向另一个哈希表节点的指针(拉链法解决哈希冲突
Redis 的字典结构


  • type 属性和 privdata 属性是针对差异类型的键值对,为创建多态字典而设置的,每个dictType结构生存了一簇用于特定特定类型键值对的函数,Redis 会为用途差异的字典设置差异的类型特定函数


  • privdata 属性生存了需要通报给那些特定函数的可选参数
  • ht 属性包罗两个项的数组,数组的每个项都是一个哈希表,一样平常只使用 ht [0],ht[1]仅在rehash的时间使用(rehash 时将 ht [0] 的键值 hash 到 ht [1] 上,然后再将 ht [0] 置为 ht [1])
  • rehashidx 也与 rehash 有关,记录了rehash目前的进度,如果目前没有在执行rehash,它的值为-1
哈希算法


  • Redis 用 MurmurHash2算法 作为计算键的哈希值:纵然输入的键有规律,该算法也能给出一个很好的随机分布性,计算速率也很快
  • Redis 的哈希表使用 链地址法来解决键冲突
  • 因为 dictEntry 节点组成的链表没有指向表尾链表的指针,所以用 头插法 插入冲突
哈希表的扩展与收缩

当以下条件之一被满足时,步伐会自动开始对哈希表执行 扩展 操作:

  • 服务器目前没有执行 BGSAVE 命令大概 BGREWRITEAOF 命令,并且 哈希表的负载因子大于即是 1
  • 服务器目前正在执行 BGSAVE 命令大概 BGREWEITEAOF 命令,并且 哈希表的负载因子大于即是 5
根据 BGSAVE 和 BGREWRITEAOF 命令是否正在执行,服务器进行扩展的负载因子不雷同,这是因为 Redis 需要创建当前服务器进程的子进程,而大多操作系统采用写时复制(WriteOnCopy)技能来优化子进程的使用效率,所以 Redis 尽量避免在子进程存在期间进行哈希扩容,这可以避免不必要的内存写入操作,最大限度节约内存
当哈希表的 负载因子小于 0.1 时 ,步伐自动开始对哈希表执行 收缩 操作
Redis 的 rehash


  • 为了让哈希表的负载因子维持到一个公道的范围内,步伐需要对哈希表的大小进行相应的扩展和收缩
  • 扩展和收缩哈希表的工作可以通过执行 rehash(重新散列)操作来完成
  • rehash 步骤

    • 为字典的 ht [1] 哈希表分配空间:

      • 如果是扩展,ht [1] 的大小为第一个大于即是 ht [0].used*2 的 \(2^n\)
      • 如果是收缩,那么 ht [1] 的大小为第一个大于即是 ht [0].used 的 \(2^n\)

    • 将生存在 ht [0] 中的所有键值对 rehash 到 ht [1] 上面
    • 当都迁移到 ht [1] 上之后,开释 ht [0],将 ht [1] 设置为 ht [0],并为 ht [1] 新创建一个空白哈希表,为下一次 rehash 做预备

渐进式 Rehash

  • redis 的 rehash 不是一次性、集中性地完成的,而是 分多次、渐进式地完成(在数据量特别大的情况下,避免对服务器性能造成影响)
渐进式 Rehash 步骤:

  • 为 ht [1] 分配空间,让字典 同时持有ht[0]和ht[1]两个哈希表
  • 在字典中维护一个索引计数器变量 rehashidx,并值设置为 0,表示 rehash 工作正式开始(没开始是-1)
  • rehash 内,如果执行增删改查,步伐会将顺带将 ht [0] 哈希表在 rehashidx 索引上的所有键值对 rehash 到 ht [1],当rehash工作完成之后,步伐将rehashidx属性的值增一
  • 当整体 rehash 完毕之后,rehashidx 值重新置为-1,表示 rehash 结束
渐进式 rehash 执行期间内的哈希表操作

  • rehash 时,字典同时又两个哈希表,删除、更新、查找操作会在两个哈希表(没有新增!)
  • 如果查找一个键的话,会 先在ht[0]上查找,如果没有找到就会在ht[1]上查找
  • 渐进式 rehash 时,新添加的键值对一律被生存到ht[1]中,ht[0]不进行任何添加操作,这包管了 ht [0] 包罗的键值对只减不增,末了 ht [0] 会变成空表
字典 API



跳跃表(skiplist)


  • 跳跃表(skiplist)是一种有序的数据结构,查找均匀 O(logN),最差 O(N)
跳跃表的实现

  1. typedef struct zskiplist {
  2.     // 表头和表尾
  3.     structz skiplistNode *header, *tail;
  4.     //表中节点数量
  5.     unsigned long length;
  6.     // 表中层数最大的节点的层数
  7.     int level;
  8. } zskiplist;
复制代码

  • header:指向跳表表头节点
  • tail:指向跳表表尾节点
  • level:记录目前跳表层数最大的那个节点的层数(表头节点层数不算)
  • length:记录跳表的长度(不算表头)
跳跃表节点



  • :level 数组可以包罗多个元素,每个元素都包罗一个指向其他节点的指针,可以通过这些层加快访问其他节点的速率

    • 每次创建一个新节点,会根据 幂次定律 随机生成一个介于 1 和 32 之间的值作为 level 数组的大小,大小就是高度

  • 前进指针:用于从表头向表尾方向访问节点
  • 跨度(level .span):用于记录两个节点之间的距离,两个节点跨度越大,相距越远

    • 指向 NULL 的所有前进指针跨度为 0
    • 所有沿途访问过的所有层的跨度加起来,就是目标节点在跳跃表中的排位

  • 后退指针:每个节点都只有一个后退指针,每个节点 只能通过后退指针跳到前一个节点
  • 分值和成员

    • 分值(score)是一个 double 类型的浮点数,节点按分值从小到大排序
    • 成员(obj)是一个指针,指向一个字符串对象,字符串对象生存一个 SDS

同一个跳跃表中,各个节点的 obj 必须是唯一的,但是 score 可以是多个
跳跃表 API


整数聚集(intset)

intset 是 Redis 用于生存整数值的抽象数据结构,可以生存类型为 int16_t, int32_t, int64_t 的整数值
只包罗整数值元素的聚集,是 聚集键的底层实现之一

  • 以有序、无重复的方式生存聚集元素,有需要时会自动根据新添加的元素类型改变数组类型
整数聚集结构


contents 数组是整数聚集的底层实现:每个元素都是 contents 数组的一个数组项(item),各个项从小到大排序,并且不包罗任何重复项

  • length:记录了 contents 整数聚集的元素个数
  • contents:属性声明为 int8_t 类型的数组,实际上不生存任何 int8_t 类型的值,真正类型取决于 encoding 属性的值
  • encoding:

    • INTSET_ENC_INT16,就是生存 int16_t 类型的数组
    • INTSET_ENC_INT32,就是生存 int32_t 类型的数组
    • INTSET_ENC_INT64,就是生存 int64_t 类型的数组

编码升级

如果新增元素的值超出当前编码类型的值范围,就会进行 upgrade 操作,然后才能将新元素添加进去
升级整数聚集并添加新元素分为三步进行:

  • 根据新元素的类型,扩展整数聚集底层数组的空间大小,并为新元素分配空间
  • 将底层数组现有的所有元素转换成与新元素雷同的类型,并将转换后的元素放置到正确的位置,放置元素过程中,需要维持底层数组的有序性不变
  • 将新元素添加到底层数组中
升级之后新元素的摆放位置
因为引发升级意味新元素比现有所有元素长度都长,所以要么大于所有元素,要么小于所有元素(负数)

  • 小于情况,新元素放置在底层数组的最开头
  • 大于情况:新元素放置在底层数组的最末尾
升级的好处

  • 提拔整数数组的灵活性:可以随意添加差异类型的元素,会自动升级,不必担心类型错误
  • 尽可能节约内存空间:可以同时生存三种类型的值,只在有需要的时间升级
整数聚集不支持降级操作,一旦升级就会保持升级的状态
整数聚集 API


压缩列表(ziplist)

压缩列表是列表键和哈希键的底层实现之一,是 Redis 为了节约内存开发的
压缩列表的结构

一个压缩列表可以生存恣意多个节点,每个节点可以生存一个字节数组大概一个整数值


  • zlbytes:记录整个压缩列表占用的内存字节数:对压缩列表内存重分配或计算 zlend 时使用
  • zltail:表尾节点距离起始地址有多少字节
  • zllen:记录了压缩列表包罗的节点数目

    • 当该值小于 UINT16_MAX(65535)时,这个属性的值就是压缩列表包罗节点的数目;
    • 即是 UINT16_MAX 时,节点真实数目需要遍历得到

  • entryX:压缩列表包罗的各个节点,长度由节点生存的内容决定
  • zlend:特殊值 0xFF(十进制 255),用于标记压缩列表的末端
压缩列表的节点构成


  • 节点可以生存一个字节数组大概一个整数值
  • previous_entry_length:记录压缩列表中前一个节点的长度

    • 如果前一个节点的长度小于 254 字节,那么该属性长度为 1 字节
    • 如果大于即是 254 字节,那么该属性长度为 5 字节:其中属性的第一字节会被设置为 0xFE(十进制值 254),之后四个字节用于生存前一个节点的长度

  • encoding:记录节点的 content 属性所生存的数据类型和长度


  • content:负责生存节点的值,值的类型和长度由节点的 encoding 属性决定
连锁更新

因为 previous_entry_length 属性记录了前一个节点的长度,如果在表头插入一个凌驾 254 长度的节点,第二个节点会 previous_entry_length 会扩展到 5 字节,此时后续节点也会因为前一个节点长度变长后(如果凌驾 254 字节),就会引发升级;

  • 连锁更新最坏情况下回对压缩列表执行 N 次空间重分配操作,而每次重分配的最坏复杂度在 O(N),所以连锁更新最坏复杂度在 O(N^2)
其时造成性能问题概率很低:很难大量节点同时处于 250~254 长度之间
压缩列表 API


数据类型(对象)

Redis 没有直接使用上面的数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统:

  • 包罗了 字符串对象、列表对象、哈希对象、聚集对象 和 有序聚集对象 这五种类型的对象
对象的类型和编码

Redis 创建键值对时,至少创建两个对象,一个对象用作 Key,另一个用作 Value

  • Redis 的每个对象都由一个 redisObject 结构表示,该结构中和生存数据有关的三个属性分别是 type 属性、encoding 属性和 ptr 属性


  • type:记录了对象的类型

    • REDIS_STRING:字符串对象 "string"
    • REDIS_LIST:列表对象 "list"
    • REDIS_HASH:哈希对象 "hash"
    • REDIS_SET:聚集对象 "set"
    • REDIS_ZSET:有序聚集对象 "zset"

  • encoding:记录了对象所使用的编码,也就是这个对象使用了上面数据结构作为底层实现

    • long类型整数、embstr编码的SDS、SDS、字典、双端链表、压缩列表、整数聚集、跳跃表和字典


Redis3.2 后,列表的 ziplist 和 linkedlist 都被 quicklist 取代,quicklist 成为了 list 的唯一实现,quicklist 结合了 ziplist 和 linkedlist


  • 每种类型的对象都至少使用了两种差异的编码,使用 OBJECT ENCODING 命令可以查察一个数据库键的值对象的编码
String 字符串


  • 字符串对象的编码可以是 int、raw 大概 embstr
  • 如果字符串生存的是一个整数值,并且这个整数值可以用 long 类型来表示,那么对象会用将其转换成整数值生存
  • 如果字符串对象生存的是一个字符串值,并且这个字符串值的长度大于 32 字节,那么字符串对象使用一个 SDS 来生存这个值
  • 如果生存的是字符串值,长度小于 32 字节,那么会用 embstr 编码方式来生存这个字符串值
embstr 编码是专门用来生存短字符串的一种优化编码方式,和 raw 一样,用 redisObject 结构和 sdshdr 结构来表示字符串对象

  • 但 raw 会调用两次内存分配函数来分布创建 redisObject 和 sdshdr
  • 但是 embstr 只会调用一次来分配连续的内存块,存储 redisObject 和 sdshdr
优点

  • 创建调用两次内存分配变为一次
  • 开释也只需要一次
  • embstr 因为所有数据生存在一块连续的内存中,所以更好利用缓存带来的优势


  • 可以用 long double 表示的浮点数在 redis 中也是用字符串生存的
编码的转换


  • int 和 embstr 的字符串对象在条件满足的情况下会被转换成 raw 编码的字符串(比如使用 append 命令)
  • Redis 没有为 embstr 编写任何相应的修改步伐,所以 embstr 编码的字符串对象实际上是只读的,对 embstr 修改会先被转换成 raw 再修改
字符串干系命令

序号命令及形貌1SET key value 设置指定 key 的值。2GET key 获取指定 key 的值。3GETRANGE key start end 返回 key 中字符串值的子字符4GETSET key value 将给定 key 的值设为 value ,并返回 key 的旧值(old value)。5GETBIT key offset 对 key 所储存的字符串值,获取指定偏移量上的位(bit)。6MGET key1 [key2..] 获取所有(一个或多个)给定 key 的值。7SETBIT key offset value 对 key 所储存的字符串值,设置或清除指定偏移量上的位(bit)。8SETEX key seconds value 将值 value 关联到 key ,并将 key 的过期时间设为 seconds (以秒为单元)。9SETNX key value 只有在 key 不存在时设置 key 的值。10SETRANGE key offset value 用 value 参数覆写给定 key 所储存的字符串值,从偏移量 offset 开始。11STRLEN key 返回 key 所储存的字符串值的长度。12MSET key value [key value ...] 同时设置一个或多个 key-value 对。13MSETNX key value [key value ...] 同时设置一个或多个 key-value 对,当且仅当所有给定 key 都不存在。14PSETEX key milliseconds value 这个命令和 SETEX 命令相似,但它以毫秒为单元设置 key 的生存时间,而不是像 SETEX 命令那样,以秒为单元。15INCR key 将 key 中储存的数字值增一。16INCRBY key increment 将 key 所储存的值加上给定的增量值(increment) 。17INCRBYFLOAT key increment 将 key 所储存的值加上给定的浮点增量值(increment) 。18DECR key 将 key 中储存的数字值减一。19DECRBY key decrement key 所储存的值减去给定的减量值(decrement) 。20APPEND key value 如果 key 已经存在并且是一个字符串, APPEND 命令将指定的 value 追加到该 key 原来值(value)的末尾。List 列表


  • 列表对象的编码使用 quicklist(Redis3.2 前使用 ziplist 和 linkedlist)
  • 在 Reids3.2 前,当所有字符串元素长度小于 64 字节并且元素数目小于 512 个,用 ziplist;否则用 linkedlist
列表命令

序号命令及形貌1[BLPOP key1 [key2] timeout](https://www.runoob.com/redis/lists-blpop.html) 移出并获取列表的第一个元素, 如果列表没有元素会阻塞列表直到等候超时或发现可弹出元素为止。2BRPOP key1 [key2 ] timeout 移出并获取列表的末了一个元素, 如果列表没有元素会阻塞列表直到等候超时或发现可弹出元素为止。3BRPOPLPUSH source destination timeout 从列表中弹出一个值,将弹出的元素插入到另外一个列表中并返回它; 如果列表没有元素会阻塞列表直到等候超时或发现可弹出元素为止。4LINDEX key index 通过索引获取列表中的元素5LINSERT key BEFORE|AFTER pivot value 在列表的元素前大概后插入元素6LLEN key 获取列表长度7LPOP key 移出并获取列表的第一个元素8[LPUSH key value1 [value2]](https://www.runoob.com/redis/lists-lpush.html) 将一个或多个值插入到列表头部9LPUSHX key value 将一个值插入到已存在的列表头部10LRANGE key start stop 获取列表指定范围内的元素11LREM key count value 移除列表元素12LSET key index value 通过索引设置列表元素的值13LTRIM key start stop 对一个列表进行修剪(trim),就是说,让列表只保留指定区间内的元素,不在指定区间之内的元素都将被删除。14RPOP key 移除列表的末了一个元素,返回值为移除的元素。15RPOPLPUSH source destination 移除列表的末了一个元素,并将该元素添加到另一个列表并返回16RPUSH key value1 [value2] 在列表中添加一个或多个值到列表尾部17RPUSHX key value 为已存在的列表添加值Hash 哈希


  • 哈希对象的编码可以是 ziplist 和 hashtable
  • ziplist 编码的哈希对象使用压缩列表作为底层实现,生存了同以键值对的两个节点总是紧挨再一起,生存键的在前,值的灾后
  • hashtable 编码的哈希对象使用字典作为底层实现,哈希对象中的每个键值对都使用一个字典键值对来生存

    • 字典的每个键都是一个字符串类型,对象中生存了键值对的键
    • 字典中的每个值都是一个字符串类型,对象中生存了键值对的值


编码转换


  • 当哈希对象同时曼珠以下两个条件时,哈希对象使用 ziplist 编码:

    • 哈希对象生存的所有键值对的键和值的字符串长度都小于 64 字节
    • 哈希对象生存的键值对数目小于 512 个;不能满足这两个条件的哈希对象需要使用 hashtable 编码

  • 当恣意一个条件不被满足,就会转换成 hashtable
哈希命令

序号命令及形貌1HDEL key field1 [field2] 删除一个或多个哈希表字段2HEXISTS key field 查察哈希表 key 中,指定的字段是否存在。3HGET key field 获取存储在哈希表中指定字段的值。4HGETALL key 获取在哈希表中指定 key 的所有字段和值5HINCRBY key field increment 为哈希表 key 中的指定字段的整数值加上增量 increment 。6HINCRBYFLOAT key field increment 为哈希表 key 中的指定字段的浮点数值加上增量 increment 。7HKEYS key 获取哈希表中的所有字段8HLEN key 获取哈希表中字段的数目9HMGET key field1 [field2] 获取所有给定字段的值10HMSET key field1 value1 [field2 value2 ] 同时将多个 field-value (域-值)对设置到哈希表 key 中。11HSET key field value 将哈希表 key 中的字段 field 的值设为 value 。12HSETSetNX key field value 只有在字段 field 不存在时,设置哈希表字段的值。13HVALS key 获取哈希表中所有值。14[HSCAN key cursor MATCH pattern] [COUNT count] 迭代哈希表中的键值对。Set 聚集


  • 聚集对象的编码可以是 intset 和 hashtable
  • intset 编码的聚集对象使用整数聚集作为底层实现
  • hashtable 使用字典,字典的每个键都是一个字符串对象,而值都是 NULL
编码转换

当聚集对象同时满足,对象使用 intset 编码:

  • 聚集对象生存的值都是整数值
  • 聚集对象生存的元素数目不凌驾 512 个
聚集命令

序号命令及形貌1SADD key member1 [member2] 向聚集添加一个或多个成员2SCARD key 获取聚集的成员数3SDIFF key1 [key2] 返回第一个聚集与其他聚集之间的差异。4SDIFFSTORE destination key1 [key2] 返回给定所有聚集的差集并存储在 destination 中5SINTER key1 [key2] 返回给定所有聚集的交集6SINTERSTORE destination key1 [key2] 返回给定所有聚集的交集并存储在 destination 中7SISMEMBER key member 判断 member 元素是否是聚集 key 的成员8SMEMBERS key 返回聚集中的所有成员9SMOVE source destination member 将 member 元素从 source 聚集移动到 destination 聚集10SPOP key 移除并返回聚集中的一个随机元素11SRANDMEMBER key [count] 返回聚集中一个或多个随机数12SREM key member1 [member2] 移除聚集中一个或多个成员13SUNION key1 [key2] 返回所有给定聚集的并集14SUNIONSTORE destination key1 [key2] 所有给定聚集的并集存储在 destination 聚集中15[SSCAN key cursor MATCH pattern] [COUNT count] 迭代聚集中的元素ZSet 有序聚集


  • 有序聚集的编码可以是 ziplist 和 skiplist
  • ziplist 编码使用压缩列表,第一个节点生存元素成员(member),第二个节点生存元素的分值(score)
  • skiplist 编码使用 zset 作为底层实现,一个 zset 结构同时 包罗一个字典和一个跳跃表
  • 固然 zset 同时使用跳表和字典来生存有序聚集元素,但 这两种数据结构都会通过指针来共享雷同的成员和分值,所以同时使用跳跃表和字典来生存聚集元素不会产生任何重复成员大概分值,也不会因此而浪费额外的内存
为什么同时用字典和跳表?

  • 只用字典:字典可以 O(1)复杂度查找成员,但是因为字典以无序存储对象,在每次执行范围操作——比如 ZRANK、ZRANGE 命令,步伐要对字典生存的所有元素排序
  • 只用跳跃表:范围操作优点保留,但是查找分值会从 O(1)上升到 O(logN)
所以同时使用字典和跳表,这样优点都可以被保留

编码转换

当同时满足以下条件,对象使用 ziplist:

  • 有序聚集生存的元素数目小于 128 个
  • 有序聚集生存的所有元素成员长度都小于 64 字节
有序聚集命令

序号命令及形貌1ZADD key score1 member1 [score2 member2] 向有序聚集添加一个或多个成员,大概更新已存在成员的分数2ZCARD key 获取有序聚集的成员数3ZCOUNT key min max 计算在有序聚集中指定区间分数的成员数4ZINCRBY key increment member 有序聚集中对指定成员的分数加上增量 increment5ZINTERSTORE destination numkeys key [key ...] 计算给定的一个或多个有序集的交集并将效果集存储在新的有序聚集 destination 中6ZLEXCOUNT key min max 在有序聚集中计算指定字典区间内成员数目7ZRANGE key start stop [WITHSCORES] 通过索引区间返回有序聚集指定区间内的成员8ZRANGEBYLEX key min max [LIMIT offset count] 通过字典区间返回有序聚集的成员9[ZRANGEBYSCORE key min max WITHSCORES] [LIMIT] 通过分数返回有序聚集指定区间内的成员10ZRANK key member 返回有序聚集中指定成员的索引11ZREM key member [member ...] 移除有序聚集中的一个或多个成员12ZREMRANGEBYLEX key min max 移除有序聚集中给定的字典区间的所有成员13ZREMRANGEBYRANK key start stop 移除有序聚集中给定的排名区间的所有成员14ZREMRANGEBYSCORE key min max 移除有序聚集中给定的分数区间的所有成员15ZREVRANGE key start stop [WITHSCORES] 返回有序集中指定区间内的成员,通过索引,分数从高到低16ZREVRANGEBYSCORE key max min [WITHSCORES] 返回有序集中指定分数区间内的成员,分数从高到低排序17ZREVRANK key member 返回有序聚集中指定成员的排名,有序集成员按分数值递减(从大到小)排序18ZSCORE key member 返回有序集中,成员的分数值19ZUNIONSTORE destination numkeys key [key ...] 计算给定的一个或多个有序集的并集,并存储在新的 key 中20[ZSCAN key cursor MATCH pattern] [COUNT count] 迭代有序聚集中的元素(包罗元素成员和元素分值)BitMap 位图

BitMap 位图:一勾通续的二进制数组,可以通过偏移量来定位元素,使用用于数据量大且二值统计的场景

  • 应用场景:二值状态统计的场景,比如签到、判断用户登陆状态、连续签到用户总数等;

  • 使用字符串类型作为底层实现类型
位图命令

命令功能SETBIT key offset value设置指定偏移量位置的位值(0 或 1),返回设置前该位置的原值(0 或 1)GETBIT key offset获取指定偏移量位置的位值(0 或 1)BITCOUNT key [start end]返回位为 1 的数目(start、end 指定起始和结束偏移量)BITOP operation destkey key1 [key2 ...]operation:位运算操作类型,可以是:
                          AND:按位与。
                          OR:按位或
                          XOR:按位异或
                          NOT:按位取反
destkey:效果存储的目标键名
key1, key2:源 Bitmap 键名,可以是一个或多个
返回值:效果位图的长度BITPOS key bit [start end]查找指定值(0 或 1)在 Bitmap 中的第一个匹配位的位置HyperLogLog 超日志

Redis HyperLogLog 是用来做基数统计的算法,HyperLogLog 的优点是,在输入元素的数目大概体积非常非常大时,计算基数所需的空间总是固定的、并且是很小的。
作用有一个容器,判断该容器当中有多少个不一样的 Key
误差:0.8125%

  • Redis 的 HyperLogLog 分为 密集存储结构 和 稀疏存储结构
  • 密集存储结构就是分配一个连续的数组,存储 16384 个 6bit 组成的桶
  • 如果比较多的计数值是 0,那么就会采用稀疏存储的结构:

    • 对于连续多个计数值为 0 的桶,Redis 使用的存储方式是:00xxxxxx,前缀两个 0,后面 6 位的值加 1 表示有连续多少个桶的计数值为 0,由于 6bit 最大能表示 64 个桶,所以 Redis 又计划了另一种表示方法:01xxxxxx yyyyyyyy,这样后面 14bit 就可以表示 16384 个桶了,而一个初始状态的 HyperLogLog 对象只需要用 2 个字节来存储
    • 如果连续的桶数都不是 0,那么 Redis 的表示方式为 1vvvvvxx,即为连续(xx+1)个桶的计数值都是(vvvvv+1)。例如,10011110 表示连续 3 个 8。这里使用 5bit,最大只能表示 32。因此,当某个计数值大于 32 时,Redis 会将这个 HyperLogLog 对象调整为密集存储

  • 恣意一个计数值从 32 变成 33,因为 VAL 指令已经无法容纳,它能表示的计数值最大为 32
  • 稀疏存储占用的总字节数凌驾 3000 字节,这个阈值可以通过 hll_sparse_max_bytes 参数进行调整。
超日志命令

序号命令及形貌1PFADD key element [element ...] 添加指定元素到 HyperLogLog 中。2PFCOUNT key [key ...] 返回给定 HyperLogLog 的基数估算值。3PFMERGE destkey sourcekey [sourcekey ...] 将多个 HyperLogLog 归并为一个 HyperLogLogGEO 地理位置


  • 用来存储地理位置信息,并对存储的信息进行操作,Redis3.2之后
  • 空间存储的方案:ArcSDE、Oracle、SQL Server、mysql、redis、es、mongodb、postgreSQL
GEO命令

命令功能GEOADD key longitude latitude member [longitude latitude member ...]geoadd 用于存储指定的地理空间位置,可以将一个或多个经度(longitude)、纬度(latitude)、位置名称(member)添加到指定的 key 中GEOPOS key member [member ...]geopos 用于从给定的 key 里返回所有指定名称(member)的位置(经度和纬度),不存在的返回 nil。`GEODIST key member1 member2 [mkmgeoradius 以给定的经纬度为中心, 返回键包罗的位置元素当中, 与中心的距离不凌驾给定最大距离的所有位置元素。
  1. GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]
复制代码
georadiusbymember 和 GEORADIUS 命令一样, 都可以找出位于指定范围内的元素, 但是 georadiusbymember 的中心点是由给定的位置元素决定的, 而不是使用经度和纬度来决定中心点。
  1. GEORADIUSBYMEMBER key member radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [COUNT count] [ASC|DESC] [STORE key] [STOREDIST key]
复制代码
对象的特性

类型检查与命令多态


  • Redis中用于操作键的命令分为两种类型

    • 可以对恣意类型的键操作,比如DEL、EXPIRE、RENAME、TYPE、OBJECT
    • 只能对特定类型的键执行

  • 类型检查的实现:类型特定命令所进行的检查通过redisObject的type属性来实现
  • 多态命令的实现:根据redisObject的encoding字段来决定执行哪个数据结构的API
内存回收


  • C语言不具备自动内存回收的功能,所以Redis在对象系统构建了一个引用计数技能来实现内存回收机制
  • 对象的生命周期可以划分为创建对象、操尴尬刁难象、开释对象三个过程
对象共享


  • 对象的引用计数属性除了用于内存回收,还带有对象共享的做作用
  • 多个键共享一个值需要执行两步:

    • 将数据库键的值指针指向一个现有的值对象
    • 将被共享的值对象的引用计数增一

Redis会在初始化服务器时,创建一万个字符串对象,这些对象包罗了从0~9999的所有整数值,当需要用上的时间,就会共享这些对象,而不是创建新对象
(类似于Java的Integer类的常量缓存池)


  • 尽管共享更复杂的对象可以节约更多内存,但是收到CPU时间的限定,Redis只对包罗整数值的字符串对象进行共享
对象空转时长


  • redisObject结构包罗的末了一个属性为lru属性,记录了该对象末了一次被步伐访问的时间
  • 如果服务器打开了maxmemory选项,并且服务器用于回收内存的算法为volatile-lru大概allkeys-lru,那么当内存凌驾了maxmemory,服务器会优先开释空转时间长的那部门键,从而回收内存

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

八卦阵

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表