渣渣兔 发表于 2024-6-15 03:41:25

【Redis7】10大数据范例之Stream范例

1. Stream简介

Redis Stream 是在Redis 5.0版本中引入的一种新的数据布局,它主要用于实时数据处理场景,如消息队列、日志记录和实时数据分析等。Stream的设计灵感部分泉源于消息队列系统,如Kafka,但它提供了更直接集成到Redis生态系统中的本领。
   简单来说:Stream就是消息中央件+阻塞队列
Redis Stream 范例自己设计时就充分考虑了生产者消耗者模子的需求。它不仅包含了这一模子,还对其进行了优化和扩展,以便更好地顺应当代分布式系统中的消息通报场景。


[*]生产者:任何可以向Redis Stream写入消息的客户端都可以视为生产者。生产者使用XADD下令向Stream中添加消息,每个消息都附有一个全局唯一的ID,确保消息的顺序性和可追踪性。
[*]消耗者:消耗者使用XREAD或XREADGROUP下令从Stream中读取消息。特殊是XREADGROUP下令,它支持消耗者组(Consumer Group)的概念,这是生产者消耗者模子中的一个紧张组成部分。消耗者组让多个消耗者可以协作处理Stream中的消息,同时保证了消息不会被重复处理。
[*]消耗者组:Stream支持消耗者组,组内的消耗者共享消息,但每个消息只由组内的一个消耗者处理,从而实现了消息的有序和公中分配。消耗者组还允许消耗者在处理失败时重新分配消息,以及通过XACK下令确认消息已成功处理,实现消息的确认机制。
[*]消息持久化与顺序性:Stream中的消息是持久化的,确保了纵然在Redis服务器重启后,消息也不会丢失。同时,Stream保持消息的严酷顺序,这对于某些依赖消息顺序的应用场景至关紧张。
[*]阻塞读取与自定义读取策略:消耗者可以选择阻塞读取模式,这意味着当没有新消息时,消耗者会等待直至新消息到达。此外,还可以通过参数定制读取的起始位置、消息数量或时间范围,提供了高度的机动性。
Stream范例主要特点:

[*]有序性:Stream中的消息按照ID排序,每个消息都有一个全局唯一的ID,确保了消息的顺序。
[*]持久化:Stream中的数据是持久化的,纵然Redis服务器重启,消息也不会丢失。
[*]多播与分组消耗:支持多个消耗者同时消耗同一流中的消息,而且可以将消耗者构造成消耗组,实现消息的分组消耗,每个消息可以被一个或多个组消耗,但组内每个消息只会被此中一个消耗者消耗(雷同于Kafka的分区消耗者模子)。
[*]机动的数据布局:每条消息可以包含多个字段(field-value对),提供了高度的机动性来携带复杂的数据。
[*]消耗者进度跟踪:消耗者可以在读取消息时自动追踪自己的消耗进度,Redis使用Last Seen Displacement (LSD) 来跟踪消耗者的读取位置。
[*]读取控制:支持多种读取模式,包括从特定消息ID读取、读取近来的N个消息、读取某个时间范围内的消息等。
[*]阻塞读取:可以使用XREAD和XREADGROUP下令以阻塞的方式等待新消息,直到有新消息到达或超时。
Stream数据布局图:
一个消息链表,将全部参加的消息都串起来,每个消息都有一个唯一的 ID 和对应的内容
https://img-blog.csdnimg.cn/img_convert/7e2cfcc261c27186830e44698ae50889.png
内容含义Message Content消息内容Consumer group消耗组,通过XGROUP CREATE 下令创建,同一个消耗组可以有多个消耗者Last_delivered_id游标,每个消耗组会有个游标 last_delivered_id,任意一个消耗者读取了消息都会使游标 last_delivered_id 往前移动。Consumer消耗者,消耗组中的消耗者Pending_ids消耗者会有一个状态变量,用于记录被当前消耗已读取但未ack的消息Id,如果客户端没有ack,这个变量内里的消息ID会越来越多,一旦某个消息被ack它就开始减少。这个pending_ids变量在Redis官方被称之为 PEL(Pending Entries List),记录了当前已经被客户端读取的消息,但是还没有 ack (Acknowledge character:确认字符),它用来确保客户端至少消耗了消息一次,而不会在网络传输的中途丢失了没处理 2. 生产消息下令(XADD)

XADD key threshold ] *|id field value :向Stream(key)中添加一条消息,ID可以是自动天生或指定的唯一标识符,后面跟着一个或多个字段值对。
这个下令有三个注意点:


[*]消息id要比上个id大
[*]默认用*表示自动天生规矩
[*]*:用于XADD下令,表示让系统自动天生id(雷同于MySQL的自增主键)
示例:
127.0.0.1:6379> xadd k1 * name zhangsan age 18
1715525079420-0 # 系统自动生成的id
127.0.0.1:6379> xadd k1 * name lisi age 19
1715525087805-0
127.0.0.1:6379> xadd k1 * name wangwu age 20
1715525094621-0
127.0.0.1:6379> xadd k1 1715525094621-0 name wangwu age 20 # 重复的id会出错
ERR The ID specified in XADD is equal or smaller than the target stream top item
127.0.0.1:6379> xadd k1 1715525094621-1 name zhaoliu age 21 # 注意这里是 -1
1715525094621-1
127.0.0.1:6379>
天生的消息ID,有两部分组成,毫秒时间戳-该毫秒内产生的第1条消息
   信息条目指的是序列号,在雷同的毫秒下序列号从0开始递增,序列号是64位长度,理论上在同一毫秒内天生的数据量无法到达这个级别,因此不用担心序列号会不敷用。millisecondsTime指的是Redis节点服务器的本地时间,如果存在当前的毫秒时间戳比以前已经存在的数据的时间戳小的话(本地时间钟后跳),那么系统将会接纳以前雷同的毫秒创建新的ID,也即redis 在增加信息条目时会检查当前 id 与上一条目标 id, 自动纠正错误的情况,一定要保证后面的 id 比前面大,一个流中信息条目标ID必须是单调增的,这是流的基础。
    客户端显示传入规则:
Redis对于ID有逼迫要求,格式必须是时间戳-自增Id这样的方式,且后续ID不能小于前一个ID
Stream的消息内容,它的布局雷同Hash布局,以key-value的情势存在。
3. 查询相关下令

3.1 获取指定范围内的消息(XRANGE)

XRANGE key start end :获取Stream中指定范围内的消息,start和end定义了消息ID的范围,COUNT限定返回结果数量。
127.0.0.1:6379> xrange k1 - + count 2
1715525079420-0
name
zhangsan
age
18
1715525087805-0
name
lisi
age
19
127.0.0.1:6379>


[*]-:表示Stream中的最小ID
[*]+:表示Stream中的最大ID
3.2 逆序获取指定范围内的消息(XREVRANGE)

XREVRANGE key end start :雷同于XRANGE,但消息按逆序返回。
示例:
127.0.0.1:6379> xrevrange k1 + - count 2
1715525094621-1
name
zhaoliu
age
21
1715525094621-0
name
wangwu
age
20
127.0.0.1:6379>
3.3 返回消息的数量(XLEN)

XLEN key:返回Stream中消息的数量。
127.0.0.1:6379> xlen k1
4
127.0.0.1:6379>
4. 删除消息下令(XDEL)

XDEL key ID :删除Stream中指定ID的消息。
127.0.0.1:6379> xlen k1
4
127.0.0.1:6379>
xdel k1 1715525079420-01127.0.0.1:6379> xlen k13127.0.0.1:6379> 5. 截取消息下令(XTRIM)

XTRIM key MAXLEN|MINID [=|~] threshold :截取Stream


[*]MAXLEN:表示允许的最大长度,保留大的
[*]MIDID:允许的最小id,这个id之前的消息会被截取掉
127.0.0.1:6379> xrange k1 - +
1715525087805-0
name
lisi
age
19
1715525094621-0
name
wangwu
age
20
1715525094621-1
name
zhaoliu
age
21
127.0.0.1:6379> xtrim k1 maxlen 2
1
127.0.0.1:6379> xrange k1 - +
1715525094621-0
name
wangwu
age
20
1715525094621-1
name
zhaoliu
age
21
127.0.0.1:6379> xtrim k1 minid 1715525094621-1
1
127.0.0.1:6379> xrange k1 - +
1715525094621-1
name
zhaoliu
age
21
127.0.0.1:6379>
6. 消耗消息下令(XREAD)

XREAD STREAMS key id :非阻塞或阻塞式读取一个或多个Stream中的消息。


[*]COUNT指定最多读取的消息数量
[*]BLOCK milliseconds指定阻塞等待新消息的最长时间(毫秒)。默认不阻塞,如果milliseconds设置为0,则永远阻塞
127.0.0.1:6379> xread count 2 streams k1 0-0
k1
1715525094621-1
name
zhaoliu
age
21
1715526892718-0
name
aaa
127.0.0.1:6379>
   0-0代表从最小的ID开始获取Stream中的消息,当不指定count,将会返回Stream中的全部消息,注意也可以使用0(00/000也都是可以的)
阻塞读取示例:
客户端1:
127.0.0.1:6379> xread count 1 block 0 streams k1 $
k1
1715527170695-0
name
ddd
127.0.0.1:6379>
客户端2:
127.0.0.1:6379> xadd k1 * name ddd
"1715527170695-0"
127.0.0.1:6379>
$:表示只消耗新的消息,比当前id还要大的id
只有当客户端2添加数据之后,客户端1才会进行消耗
7. 消耗者组管理下令

消息创建好之后,就必要消耗者来进行消耗.而创建消耗者要分组进行创建.
7.1 创建消耗者组(XGROUP)

XGROUP create key groupname id|$ :创建一个新的消耗者组。
127.0.0.1:6379> XGROUP create k1 group1 $
OK
127.0.0.1:6379> XGROUP create k1 group2 0
OK
127.0.0.1:6379>


[*]$表示消耗新来de
[*]0表示从Stream头部开始消耗
7.2 在消耗者组中读取消息(XREADGROUP)

XREADGROUP GROUP group consumer STREAMS key id :在消耗者组中读取消息,支持消息确认机制(通过ACK或NOACK)。
127.0.0.1:6379> XGROUP create k1 group2 0
OK
127.0.0.1:6379> xreadgroup group group2 consumer1 streams k1 >
k1
1715570723943-0
f1
v1
1715570728646-0
f2
v2
1715570732271-0
f3
v3
1715570735727-0
f4
v4
127.0.0.1:6379> xreadgroup group group2 consumer2 streams k1 >

127.0.0.1:6379>


[*] >:用于XREADGROUP下令,表示迄今还没有发送给组中使用者的信息,会更新消耗者组的末了ID
[*] 消耗者不存在时,会自动创建
group2这个组中的consumer1读完了k1中的全部消息,那么当group2中consumer2再来读时,就读不到任何消息了.
但当我新建一个group3组,在group3组中读数据时,又可以或许读到消息.
127.0.0.1:6379> XGROUP create k1 group3 0
OK
127.0.0.1:6379> xreadgroup group group3 consumer3 streams k1 >
k1
1715570723943-0
f1
v1
1715570728646-0
f2
v2
1715570732271-0
f3
v3
1715570735727-0
f4
v4
127.0.0.1:6379>
   这是由于同组共享一个队列信息.这个组就相称mq中的队列,不同消耗者读取同一个队列的时间每条消息只能被消耗一次,但是同一条消息可以被不同队列的不同消耗者同时消耗,也就是广播
为了防止一个消耗者读完全部消息,我们可以使用count参数来限定消耗者读取几条消息,以此实现负载均衡
示例:
127.0.0.1:6379> xreadgroup group group4 consumer1 count 2 streams k1 > # 限制只能读2条消息
k1
1715570723943-0
f1
v1
1715570728646-0
f2
v2
127.0.0.1:6379> xreadgroup group group4 consumer2 count 2 streams k1 >
k1
1715570732271-0
f3
v3
1715570735727-0
f4
v4
127.0.0.1:6379>
7.3 查询消耗者组的信息(XPENDING)

XPENDING key group [ start end count ]:查询消耗者组的信息,包括待处理消息的数量等。
示例:
127.0.0.1:6379> xpending k1 group2 # group2组中消费读取情况
4
1715570723943-0
1715570735727-0
consumer1
4
127.0.0.1:6379> xpending k1 group4 # group4组中消费读取情况
4
1715570723943-0
1715570735727-0
consumer1
2
consumer2
2
127.0.0.1:6379>
7.4 确认消耗者成功处理了消息(XACK)

XACK key group id :用于确认(acknowledge)消耗者已经成功处理了消息。
示例:
127.0.0.1:6379> xpending k1 group4 - + 5 consumer1
1715570723943-0
consumer1
543165
1
1715570728646-0
consumer1
543165
1
127.0.0.1:6379> xack k1 group4 1715570723943-0
1
127.0.0.1:6379> xpending k1 group4 - + 5 consumer1
1715570728646-0
consumer1
574237
1
127.0.0.1:6379>
当客户端从Stream中读取消息后,会使用XACK下令告知Redis,它所指定的消息ID对应的消息已经得到了妥善处理。Redis吸收到XACK下令后,会将这些消息ID从消耗者组的待确认(pending)消息列表中移除,这样,这些消息就不会再次被同一个消耗者组内的消耗者获取到,实现了消息的确认与去重处理。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 【Redis7】10大数据范例之Stream范例