卖不甜枣 发表于 2024-6-19 15:55:54

数据加速器 GooseFS 1.4 版本正式发布

腾讯云存储团队正式发布数据加速器 GooseFS 1.4 版本(含 GooseFS 1.4.0 和 GooseFS 1.4.1 版本),该版本针对 AI、大数据场景提供了文件解压缩等便捷易用的工具,同时针对海量文件读写下的集群性能和稳固性题目进行了针对性优化,提升了产品竞争力。
重点更新点一:提供文件解压缩能力
 AI 场景下,业务团队大概会将大量用于训练大概学习的文件打包成一个压缩包并上传到对象存储中;在执行训练大概学习使命时,再将压缩包文件下载到本地并解压。这一流程会对底层对象存储服务产生较大的读带宽,每次启动使命时,无论需要读取多少文件,都需要将文件所处的压缩包整包下载才可以执行。
GooseFS 在本次更新中团结 COS 服务提供了服务端的解压缩能力,支持通过解压缩工具向 COS 服务端发起解压缩请求,提升文件访问性能。GooseFS 支持文件解压缩能力的基本框架如下:
https://img-blog.csdnimg.cn/img_convert/6f8aaadfbb8f52425b50b7d30ca07d62.jpeg

团体流程上:
1. 首先通过 GooseFS 解压缩指令`goosefs fs decompress`向 COS 服务发起指定文件的解压缩请求。
2. COS 服务收到解压缩请求后,会向解压缩服务模块提交解压缩使命,由文件加压缩模块管理使命进度。
3. 解压缩过程中,用户可以通过`goosefs fs queryDecompress`指令查询解压缩使命的状态。
4. 解压缩使命完成后,完成解压后的文件会输出至用户指定的文件目次中。
5. 支持通过`goosefs fs listDecompressJobs <namespace>`指令查阅指定命名空间的解压缩使命希望。
 
GooseFS 提供的解压缩能力目前仍旧在公测阶段,公测阶段有地区和可用区限定,但暂不进行收费,如需利用可以提交工单申请。
利用 GooseFS 文件解压缩能力的上风如下:
1. 避免文件读放大题目,减少底层对象存储服务的读带宽。用户在服务端侧完成解压缩后,只需按需读取需要用到的文件,无需读取整个压缩包。
2. 减少客户端侧的 CPU 压力。用户无需在客户端侧执行解压缩操作,可以让宝贵的计算资源聚焦在 AI 计算使命上。
 
重点更新点二:支持暂时密钥主动热更新

GooseFS通过托管在集群中的密钥访问远端的对象存储服务。腾讯云的永久密钥具备永久的有用期,暂时密钥的有用期则可以由用户自行指定,最长不凌驾 2 小时。在 GooseFS 集群中托管永久密钥存在一定的安全风险,比如当永久密钥泄露时,对象存储服务中的文件将持续存在泄露的风险。因此在本次更新中,GooseFS 团队提供了暂时密钥托管的模式。

通过暂时密钥托管服务,用户可以只在 Worker 节点上缓存从 Master 节点拉取的暂时密钥信息,并通过暂时密钥访问远端对象存储服务,获取业务所需数据。GooseFS 支持暂时秘钥托管服务的团体框架如下所示:
https://img-blog.csdnimg.cn/img_convert/e86761f2cf9487820556b76b305e1f04.jpeg

团体流程上:
1. 在 Worker 节点中,可以周期性地通过以下指令,变动节点上的暂时密钥信息。
`goosefs ns update <namespace> [--secret <key=value>] [--attribute fs.cosn.userinfo.sessionToken=xxx]`
2. 客户端读取文件时,假如文件未缓存在 Worker 节点上,Worker 节点可以通过暂时密钥访问远端对象存储服务拉取文件。
利用 GooseFS 暂时密钥托管重要可以减少密钥泄露带来的安全风险。GooseFS 集群中大概管理成百上千台 Worker 节点,每一台 Worker 节点中都持久化永久密钥大大增加了密钥泄露的概率,利用暂时密钥可以极大缓解此类风险。
 
重点更新点三:GooseFS-FUSE客户端支持降级读

GooseFS-FUSE 可以在一台 Unix 机器上的本地文件体系中挂载一个 GooseFS 分布式文件体系。通过利用该特性,一些尺度的下令行工具(例如 ls、cat 以及 echo)可以直接访问 GooseFS 分布式文件体系中的数据。GooseFS-FUSE 在访问 GooseFS 时,需要先到 GooseFS 集群中获取缓存文件,假如文件不存在,GooseFS 会到远端对象存储服务上拉取文件。假如 GooseFS 集群的 Master 节点异常(比如 Standalone 模式的 Master 节点宕机,HA 模式的多节点主备切换),导致集群团体不可用时,GooseFS-FUSE 将无法读取到文件,导致客户端也不可用。

GooseFS-FUSE 客户端在本期更新中新增了降级读能力,可以在 Master 节点异常时透传 FUSE 客户端的请求到远端对象存储服务上,这一能力有助于提升客户端团体的可用性。
团体流程上:
1.默认环境下,GooseFS-FUSE 默认会去 Master 节点获取文件元数据信息,并读取 GooseFS 集群中的文件;
2.节点异常的环境下,GooseFS-FUSE 会启用降级读模式,直接去远端对象存储中读取文件。
其他更新点

除了上述更新之外,我们在本次版本中优化了 GooseFS 的产品性能和稳固性,进一步提升 GooseFS 在大数据、AI 场景下的集群稳固性。重要更新点如下:
1. GooseFS distributedLoad 能力支持层级遍历能力,支持递归拉取指定目次下的元数据信息。(GooseFS 1.4.0)
2. FUSE 随机读性能优化。(GooseFS 1.4.0)
3. 增加 Master 查询/更新 RocksDB 的分位耗时监控,提升元数据服务的监控敏捷度。(GooseFS 1.4.0)
4. 优化了 GooseFS HA模式下的集群规复时间,提升了集群可用性。(GooseFS 1.4.0)
5. CosN 依靠版本升级,支持通过原生 HDFS 协议访问开启元数据加速的存储桶,提升大数据场景下的文件操作性能。(GooseFS 1.4.0)
6. GooseFS 设置精简优化,减少了不须要的设置项,提升了设置易用性。(GooseFS 1.4.0)
7. listInfo 精简优化。(GooseFS 1.4.0)
8. 大文件顺序读优化。(GooseFS 1.4.0)
9. 支持清理和查看未完成文件列表(GooseFS 1.4.1)
10. 优化递归加载元数据(loadmetadata -R)操作加锁粒度(GooseFS 1.4.1)
同时,GooseFS 1.4  版本还修复了多少题目,此中存在潜在稳固性风险的重要修复点如下:
1. 修复 Worker 吸取大量无效 async block 的请求。(GooseFS 1.4.0)
2. 优化 Worker 上报时对孤立 block 的处置惩罚逻辑。(GooseFS 1.4.0)
3. 修复 Flume 写入场景认证流和数据流状态同一题目。(GooseFS 1.4.1)
4. 修复大文件写入耗尽客户端资源后死锁的题目。(GooseFS 1.4.1)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 数据加速器 GooseFS 1.4 版本正式发布