反转基因福娃 发表于 2024-6-11 13:25:04

AWS DAS认证考点整理(Kinesis篇)


[*]Kinesis Data Stream = KDS
[*]Kinesis Data Firehose = KDF
[*]Kinesis Data Analytics = KDA
[*]Kinesis Producer Library=KPL
[*]Kinesis Consumer Library=KCL
KDF vs KDS


[*]KDS=realtime, KDF=near-real-time。
[*]KDS&KDF最大消息=1MB, SQS最大消息=256KB,Kafka最大消息=15MB。
[*]KDS支持排序,SQS只有FIFO队列支持排序,平凡SQS不支持。
[*]KDS 写入消息偏慢:1. 基于吞吐量优化消息生产者,2. 基于吞吐量优化service limit。
[*]KDS的destination包罗KDF,KDA和Lambda。
[*]KPL对KDS读写,KCL是KDS的斲丧者,Kinesis agent写入KDF。
KDF


[*]KDF+Amazon Opensearch+Kibana=near-real-time analytics。
[*]KDF有Opensearch、 S3、Redshift作为destination。KDA也可以分析KDF数据流。
[*]KDF data latency = 1min
[*]KDF改善性能,调解buffer size/buffer intervals。
KDS


[*]KDS重复数据:1. Producer有网络耽误,2. Shards、Record Processors有增减。
[*]由于网络等不可抗力造成的KDS数据重复可以通过加入唯一码(Unique ID)来去重解决。
[*]KCL ExpiredIteratorExceptions=增长DynamoDB的写入单元(write capacity units)。
[*]KCL Poll delay=1sec,通过修改propagation delay in KCL default setting可以降低。
[*]KDS的每个shard可以用一个Lambda进行处置惩罚,如果处置惩罚过慢可以增长shard。此外当一个stream有多个斲丧者时可以利用fan-out提升性能。还有一种提升性能的办法叫HTTP/2,这种协议比HTTP读取速率更快。但这两种办法都要额外收费。
[*]一个KDS可以有多个斲丧者。一个KDS fan-out lambda支持最多20个终端。
[*]KDS现实吞吐量小于assigned streams throughput:shard分配不平衡。
[*]KDS可以保留数据长达一年。
[*]KDS encrypted at rest = Server-side encryption with CMK in KMS
[*]KDS有VPC Endpoint保证流量不消走公网
[*]KDS + API Gateway = Kinesis Proxy
[*]KPL会buffer records,如果要最快,直接调用PutRecord/PutRecords。
[*]KDS stream resize后,通过process parent shard去避免记录乱序。
[*]KDS throttle write requests:increase shards(UpdateShardCount API),choose partition key.
[*]CloudWatch Subscription Filter跨account传给KDS= IAM Role and Trust policy.
KDA 


[*]KDA from S3/MCK/KDS to S3/MCK/KDS。KDA还能分析KDF数据流。
[*]KDA利用S3文件,reference data source,主动推测布局。
[*]KDA for SQL不支持MSK,不支持schema改变。
[*]KDA基于Flink,open-source兼容。
MSK


[*]MSK支持storage auto scale up。
[*]Kafka Topic权限控制=Kafka ACL

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: AWS DAS认证考点整理(Kinesis篇)