ToB企服应用市场:ToB评测及商务社交产业平台

标题: Thesios: Synthesizing Accurate Counterfactual I/O Traces from I/O Samp [打印本页]

作者: 金歌    时间: 2024-6-14 22:57
标题: Thesios: Synthesizing Accurate Counterfactual I/O Traces from I/O Samp
ASPLOS 2024 Paper 论文阅读条记整理
问题

在设计大规模分布式存储体系时,I/O活动的建模至关重要。具有代表性的/O跟踪,可以对现有硬件、设置和计谋进行详细的性能评估。假设跟踪进一步支持分析假设情况,例如摆设新的存储硬件、更改设置和修改数据放置计谋。如果没有代表性的跟踪,就很难准确地获得I/O哀求到达时间和列队结果等信息。如何没有假设跟踪,分析方法是摆设预期的更改并权衡其随时间的影响,这是昂贵、耗时和有风险的。
获得磁盘的代表性I/O跟踪的一种方法是无损地(以全分辨率)捕获它们。但网络和生存每个操作的陈迹不仅在存储和处理本钱方面很昂贵,而且还会干扰前台工作负载。因此使用下采样的I/O跟踪是一种常规做法[15,59,76]。但I/O操作的子集不敷以表征存储服务器或磁盘的完整行为,而且无法模拟假设更改的影响。如何用下采样的I/O跟踪,合成准确和全分辨率I/O跟踪和假设I/O跟踪存在寻衅。
寻衅


本文方法

本文提出了Thesios,使用来自多个服务器的多个磁盘上的下采样I/O轨迹,准确地合成代表性和假设的全分辨率I/O轨迹。
合成代表性全分辨率I/O轨迹:
利用数据中心中现有的采样基础架构,该架构网络存储服务器接收的哀求的I/O样本。包含:操作类型、文件名、I/O巨细、到达服务器的时间、磁盘时间、延迟等信息。
开源数据:GitHub - google-research-datasets/thesios: This repository describes I/O traces of Google storage servers and disks synthesized by Thesios. Thesios synthesizes representative I/O traces by combining down-sampled I/O traces collected from multiple disks (HDDs) attached to multiple storage servers in Google distributed storage system.


将Thesios应用于谷歌定期采样的真实世界的跟踪表明,与从现实磁盘网络的指标相比,合成跟踪在读/写哀求数方面实现了95–99.5%的准确率,在利用率方面实现了90–97%的准确率,在读延迟方面实现了80–99.8%的准确率,还可以捕获超过95%置信度的日波动和周波动。
合成假设全分辨率I/O轨迹:
假设I/O轨迹的性能,如延迟、能耗和缓存命中率,可以使用轻量级服务器模拟器进行评估,也可以使用成熟的服务器模拟器执行轨迹重放。服务器模拟器和服务器模拟器可以结合预期的计谋或硬件变化。通过进行四个案例研究来说明Thesios的多功能性:

总结

针对大型数据中心中,如何以部门采样的I/O轨迹合成准确的全分辨率I/O轨迹。本文提出Thesios,利用多个下采样I/O轨迹合成全分辨率I/O轨迹。合成代表性I/O轨迹:(1)利用现有的采样基础架构,网络下采样I/O轨迹。(2)组合具有相似磁盘特性的磁盘的I/O样本。利用I/O轨迹分析磁盘特性,如容量、热/冷数据比率、填充度。(3)重新加权I/O跟踪,以避免毛病和偏斜,并赔偿由于突发而丢失的样本,生成服务器级别I/O跟踪。(4)为获得磁盘级别的到达时间和延迟,思量列队延迟和特定于哀求序列的基于优先级的重排序。合成假设的全分辨率I/O轨迹:使用轻量级服务器模拟器进行评估,或使用成熟的服务器模拟器执行轨迹重放。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4