宝塔山 发表于 2024-8-27 10:31:51

ZNS SSD是不是长期缓存的理想选择?

随着数据量的增加和技术的进步,对于高效、可靠的存储解决方案的需求日益增长。传统的基于块的SSD固然具有本钱效益和长期性的优点,但在处理写密集型和更新密集型工作负载时存在局限性。
NAND闪存的特点是数据只能按页(比方4KiB)写入,不支持原地更新,必须以块为单位进行擦除。然而,块接口的局限性在于需要通过垃圾收集(GC)来支持4KiB的原地更新,而且无法感知擦除行为,导致不可控的垃圾收集引发不稳定延迟。这些问题在缓存工作负载中尤为突出,由于它们通常是写密集型和更新密集型的,并倾向于高容量使用率。

https://img-blog.csdnimg.cn/img_convert/21900d95c40fbb289a04a94ee1419ba0.png
长期缓存(Persistent Cache)是指一种用于存储频仍访问的数据,并能在系统重启后仍旧保留这些数据的缓存机制。长期缓存结合了缓存的快速访问特性和非易失性存储的长期性,使得数据能够在系统断电后仍旧得以保存,从而提高了数据的可靠性和系统的整体性能。随着固态存储技术的进步,特别是ZNS SSDs等新型存储技术的发展,长期缓存的应用范围将进一步扩大,为各种高性能盘算场景提供支持。
扩展阅读:


[*] ZNS SSD+F2FS文件系统|怎样低落GC开销?
[*] 为什么QLC NAND才是ZNS SSD最大的赢家?
[*] 字节跳动ZNS SSD应用案例解析
[*] NVMe SSD:ZNS与FDP对决,你选谁?
Zoned Namespace SSDs(ZNS SSDs)作为一种新兴技术,旨在克服传统SSD在某些场景下的局限性,特别是在长期缓存系统中的应用。ZNS SSDs通过提供一种新接口来克服传统SSD的一些限制,尤其是在某些应用场景下。详细来说,ZNS SSDs能够淘汰内部垃圾收集过程中的写放大(WA),这有助于延长SSD的寿命并避免因额外的数据移动而导致的吞吐量低落和不稳定延迟。此外,与相同本钱的传统SSD相比,ZNS SSDs可以提供更大的存储容量。

https://img-blog.csdnimg.cn/img_convert/fa0f9e0e10a82c1f00f9133aa67ac699.png
闪存缓存被广泛应用于各种场景,比方Meta的CacheLib就是一个典型的例子。闪存缓存通常将缓存项构造成大的段(比方Region),并通过文件或直接使用原始装备来淘汰I/O开销和低落写放大(Write Amplification, WA),缓存空间几乎总是被充分使用。此外,使用缓存时,大量的随机更新会加剧写放大现象,进而影响性能。ZNS SSDs为长期缓存系统提供了很多潜在的利益,包括更大的存储空间、更低的尾部延迟和更少的写放大。这些特点使得ZNS SSDs成为长期缓存系统的一个极具吸引力的选择。
当前长期缓存引擎的局限性



[*] 基于文件系统的长期缓存:这类引擎通常使用文件系统作为底层存储,这在很大程度上简化了缓存管理,但文件系统的设计并不适合ZNS SSDs的要求。文件系统中的原地更新会导致写放大,增加垃圾回收的频率,从而影响SSD的性能和寿命。
[*] 基于标准SSD的长期缓存:这类引擎直接使用标准SSD作为存储介质,固然可以淘汰文件系统的开销,但仍旧存在不兼容ZNS SSDs的问题。标准SSD通常不支持ZNS SSDs的Zone管理功能,导致无法充分使用ZNS SSDs的上风。
设计垃圾回收机制的挑战



[*] 写放大:传统SSD中的垃圾回收过程每每导致写放大,即为了更新一小部分数据,需要写入更多数据。在ZNS SSDs中,由于只支持次序写入,需要重新考虑怎样在不增加写放大的环境下执行更新操作。
[*] 缓存性能:在设计垃圾回收机制时,需要考虑怎样不影响缓存的读写性能。高效的垃圾回收计谋应该尽大概淘汰对缓存操作的影响,确保缓存服务的快速响应。
[*] 缓存掷中率:缓存掷中率是衡量缓存系统性能的关键指标之一。设计垃圾回收机制时需要考虑怎样通过合理的缓存替换计谋来提高缓存掷中率。
一、ZNS SSD作为长期缓存技术分析

面临ZNS SSDs作为长期缓存后端的挑战,需要对现有的缓存引擎进行改进和优化,以充分发挥ZNS SSDs的上风。这涉及到重新设计垃圾回收机制、磨损平衡计谋等关键组件,以实现更好的性能和更长的SSD寿命。通过这些改进,ZNS SSDs可以为长期缓存系统提供更加高效、可靠和长期的存储解决方案。
为了探索使用ZNS SSDs作为长期缓存后端的大概性和权衡,研究者提出了三种大概的设计方案:


[*] 文件缓存:使用兼容ZNS的文件系统,实现完全透明化。
[*] Zone缓存:直接将缓存的SSD管理单位映射到固定大小的地区。
[*] 中心层缓存:使用一个简单的中心层将地区接口转换为缓存管理单位的接口。
1.文件缓存

在考虑使用ZNS SSDs作为长期缓存后端时,一种大概的方案是使用兼容ZNS的文件系统。这种方案旨在通过提供通用的文件接口来实现缓存功能,但同时也带来了一些额外的开销和挑战。

https://img-blog.csdnimg.cn/img_convert/f739d730601c9da677a173202d746113.png
文件系统缓存方案 (File-Cache)



[*] 文件系统:使用兼容ZNS的文件系统(比方F2FS)来提供通用的文件接口。
[*] 缓存管理:缓存项按照Region进行构造,每个Region对应ZNS SSDs的一个或多个Zone。
[*] 数据构造:每个Region包含多个Zone,每个Zone大小固定,比方16MiB。
[*] I/O单位:文件系统以4KiB为单位进行I/O操作。
[*] 元数据与数据分离:文件系统将元数据和数据分开存储,以淘汰写放大。
[*] 重用机制:文件系统支持Zone的重用(reclaim),以便释放不再使用的空间。
技术细节与挑战



[*] 额外开销:使用文件系统会引入额外的开销,包括元数据管理、索引结构维护等。
[*] 文件系统构建:需要额外的SSD来构建文件系统,比方使用F2FS作为底层文件系统。
[*] 全透明性:文件系统提供的全透明接口使得优化垃圾收集变得困难。
[*] 性能影响:文件系统的额外开销大概会对缓存性能产生负面影响。
[*] 空间使用率:文件系统的特性大概会导致空间使用率不如直接受理ZNS SSDs的方式高。
使用兼容ZNS的文件系统作为长期缓存的方案固然简单且易于集成,但对于寻求高性能和低延迟的应用来说,它大概不是最佳选择。额外的文件系统开销和限制的优化能力大概会影响缓存系统的整体性能。因此,在选择使用兼容ZNS的文件系统之前,应细致考虑实在用性和潜在的性能影响。

2.Zone缓存

在考虑使用ZNS SSDs作为长期缓存后端时,另一种大概的方案是直接使用ZNS SSDs的Zone接口,并将缓存管理单位(Region)与Zone大小相匹配。这种方案旨在淘汰映射开销,实现无垃圾回收的设计,并消除写放大现象。

https://img-blog.csdnimg.cn/img_convert/93b768f3e2959f49d3f5740a455add44.png
直接使用Zone接口 (Zone-Cache)



[*] 直接使用Zone接口:直接使用ZNS SSDs的Zone接口进行缓存管理,而不是通过文件系统或其他中心层,可以淘汰映射缓存管理单位到物理存储的开销。
[*] 缓存管理单位与Zone匹配:将缓存中的Region映射到ZNS SSDs的Zone上,使得每个Region对应一个或多个Zone。
[*] 无垃圾回收设计:由于ZNS SSDs的特性,可以实现零写放大,不需要进行内部垃圾回收。
[*] 无OP空间:由于Zone的管理直接由应用步伐控制,不需要额外的预留空间OP来支持垃圾回收过程。
在考虑使用ZNS SSDs作为长期缓存后端时,直接使用Zone接口,并将缓存管理单位(Region)与Zone大小相匹配是一种可行的方案。然而,较大的Region大小大概会导致更长的Region插入时间和更大的内存斲丧。


[*] 更长的Region插入时间:较大的Region大小意味着在插入新数据时需要更多的时间来完成整个Region的添补。这大概会影响缓存的响应时间。
[*] 更大的内存斲丧:较大的Region大小需要更多的内存来维护Region的状态信息,比方Region的使用环境、位置信息等。这大概会增加缓存系统的内存负担。

https://img-blog.csdnimg.cn/img_convert/f6e14de69e5bddce43958b74c4ce618b.png
直接使用ZNS SSDs的Zone接口作为长期缓存后端的方案淘汰了映射开销,实现了无垃圾回收的设计,并消除了写放大现象。这种方案对于寻求高性能和低延迟的应用来说是一个很好的选择。然而,需要注意的是较大的Region大小大概会导致更长的Region插入时间和更大的内存斲丧,这大概需要在现实应用中通过适当的Region大小选择来平衡性能和资源斲丧。
3.中心层缓存

在考虑使用ZNS SSDs作为长期缓存后端时,使用一个简单的中心层来提供地区接口是一种可行的方案。这种方案旨在通过中心层提供缓存管理单位(Region)与ZNS SSDs的Zone之间的适配,同时答应Region具有符合的大小。

https://img-blog.csdnimg.cn/img_convert/0ead9e9fdcf6efcf1cdf53db7f268eb9.png
使用中心层提供地区接口 (Region-Cache)



[*] 使用中心层:使用一个简单的中心层来提供地区接口,该中心层专为缓存系统(如CacheLib)设计。通过中心层,可以为Region设定一个符合的大小,如许可以更好地适应缓存系统的需求。
[*] 缓存管理单位与Zone适配:中心层负责将缓存中的Region映射到ZNS SSDs的Zone上,使得每个Region可以具有一个符合的大小,而不是严酷匹配Zone的大小。
[*] 需要预留空间和垃圾收集:只管中心层提供了一个更灵活的接口,但它仍旧需要预留空间OP来支持垃圾回收过程,而且需要实现垃圾回收机制来优化写放大。
中心层的存在可以提供更灵活的Region大小选择,但同时也引入了额外的映射开销。此外,预留空间和垃圾收集过程大概会对性能产生一定影响,需要在设计时予以考虑。
二、实验效果分析

1.根据微观评估效果,可以看出每种解决方案都有其独特的上风:



[*] Block-Cache:这是一种使用常规SSD的传统缓存解决方案。它可以提供稳定的性能,但由于需要进行垃圾回收,大概会遇到写放大问题,影响掷中率。实用于需要稳定性能和不需要特别关注写放大问题的应用场景。
[*] Zone-Cache:由于其无垃圾回收的设计,Zone-Cache能够获得最高的掷中率。由于ZNS SSDs的特性,一旦数据写入Zone后,需要重置整个Zone才华再次使用,这消除了内部垃圾回收的需要,从而避免了写放大。实用于寻求最高掷中率的应用场景,特别是那些对延迟敏感且希望避免垃圾收集带来的性能降落的应用。
[*] Region-Cache:Region-Cache可以通过中心层提供缓存管理单位与ZNS SSDs之间的适配,使得Region可以具有一个符合的大小。它可以提供与Block-Cache相似的高吞吐量,但在掷中率方面大概略逊于Zone-Cache。实用于需要高吞吐量和具有一定灵活性的应用场景,通过中心层提供的适配可以在性能和资源斲丧之间取得精良的平衡。

https://img-blog.csdnimg.cn/img_convert/8269eec4c1c7ac1c993cc34896b2c54a.png
2.对RocksDB的评估:作为二级缓存的差异设计方案

在RocksDB中作为二级缓存的差异设计方案的评估效果。这些评估重点关注了Region-Cache、Block-Cache以及Zone-Cache在吞吐量、延迟等方面的性能表现。

https://img-blog.csdnimg.cn/img_convert/a374f705721c7236f27c26fd66e9c7ac.png


[*] Region-Cache:


[*]

[*] 延迟:由于Region-Cache通过中心层提供缓存管理单位与ZNS SSDs之间的适配,它可以有效地管理和调理数据,从而实现较低的延迟。
[*] 吞吐量:Region-Cache通过中心层提供的适配,使得Region可以具有一个符合的大小,这有助于提高数据的读写服从,从而实现较高的吞吐量。
[*] 上风:Region-Cache方案通过中心层提供的缓存管理单位与ZNS SSDs之间的适配,不但提供了较低的延迟,还保持了较高的吞吐量。



[*] Block-Cache:


[*]

[*] 尾部延迟:Block-Cache方案使用常规SSD作为缓存后端,由于需要进行垃圾回收,大概会遇到写放大问题,导致较高的尾部延迟。
[*] 劣势:Block-Cache方案在尾部延迟方面表现不佳,特别是在p99的延迟上最高,这大概是由于垃圾收集导致的写放大问题所引起的。



[*] Zone-Cache:


[*]

[*] 掷中率:Zone-Cache方案由于其无垃圾回收的设计,可以实现最高的掷中率。这有助于淘汰访问延迟并提高整体性能。


https://img-blog.csdnimg.cn/img_convert/a6a9229f0a767950699ab35d59e9a397.png
根据这些评估效果,假如目的是在RocksDB中实现最低的延迟和最高的吞吐量,则Region-Cache是最优的选择。然而,假如应用步伐对掷中率有较高要求,则Zone-Cache大概是一个更好的选择。
在本文中,研究职员提出了三种大概的方案,旨在使用ZNS SSDs作为长期缓存,并对其进行了详细的分析与评估。与常规SSD相比,ZNS SSDs可以作为更优秀的存储装备用于长期缓存。这一结论也在将ZNS SSD用作RocksDB的二级缓存时得到了验证。


[*] Region-Cache:在作为RocksDB的二级缓存时,Region-Cache方案展现出了最低的延迟和最高的吞吐量。
[*] Block-Cache:相比之下,Block-Cache方案固然提供了稳定的性能,但由于垃圾回收导致的写放大问题,它的尾部延迟表现不佳。
[*] Zone-Cache:Zone-Cache方案由于其无垃圾回收的设计,可以实现最高的掷中率,这对于淘汰访问延迟和提高性能至关紧张。
总之,ZNS SSDs作为一种新型的存储装备,具有独特的性能上风,可以作为长期缓存的理想选择。未来的研究方向应该会集在改进Zone管理机制、开发更多优化的驱逐计谋以及设计新型计谋来实现装备-缓存-应用协同设计。这些研究将进一步提高ZNS SSDs在长期缓存应用场景中的性能和服从。
参考文献:Yang, Chongzhuo, Zhang Cao, Chang Guo, Ming Zhao and Zhichao Cao. “Can ZNS SSDs be Better Storage Devices for Persistent Cache?” Proceedings of the 16th ACM Workshop on Hot Topics in Storage and File Systems (2024): n. pag.


假如您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!
出色保举:


[*] 太上老君的“三味真火”也可以提升3D NAND可靠性!
[*] FMS 2024:多家厂商CXL技术方案总览
[*] 存储正式迈入超大容量SSD时代!
[*] FMS 2024: 带来哪些存储技术亮点?
[*] IEEE报告解读:存储技术发展趋势分析
[*] 什么?陶瓷也可以用来存储数据了?
[*] 都说固态硬盘寿命短,那么谁把使用寿命用完了吗?
[*] 内存原生CRAM技术将会颠覆盘算存储的未来?
[*] 浅析SSD性能与NAND速率的关联
[*] MCR DIMM怎样解决内存带宽瓶颈?
[*] 浅析MPS对PCIe系统稳定性的影响
[*] CXL-GPU: 全球首款实现百ns以内的低延迟CXL解决方案
[*] 万字长文|下一代系统内存数据加快接口SDXI解读
[*] 数据中心:AI范式下的内存挑战与机遇
[*] WDC西部数据闪存业务救赎之路,会成功吗?
[*] 属于PCIe 7.0的那道光来了~
[*] 深度剖析:AI存储架构的挑战与解决方案
[*] CXL崛起:2024启航,2025年开启新时代
[*] NVMe SSD:ZNS与FDP对决,你选谁?
[*] 浅析PCI设置空间
[*] 浅析PCIe系统性能
[*] 存储随笔《NVMe专题》大合集及PDF版正式发布!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: ZNS SSD是不是长期缓存的理想选择?