摘要:随着云计算的兴起和渗透,云数仓成为了数仓技术演进的新阶段,并且逐渐成为了众多企业的共同选择。本文分享自华为云社区《从GaussDB(DWS)的技术演进,看数据仓库的积淀与新生》,作者: 华为云头条。
比如华为云早在 2011 年就开始做数据仓库——GaussDB(DWS)的预研,在经受了海量自有业务数据的考验后,于2015年推向市场,面向金融、政府传统一体机等企业级核心数仓场景提供服务,2017年 GaussDB(DWS)上云,进一步提升了服务能力与服务范畴。据华为云数仓GaussDB(DWS)资深产品专家黄海燕介绍,GaussDB(DWS)是华为云数据生产线上的一个明星产品,是支持实时入库、实时分析、批量运算、交互式查询的一站式分析平台,具备传统数仓的超大规模、高性能、高并发等优势,同时也具备云原生数仓的存算分离、弹性伸缩、Serverless、湖仓一体和数智融合等能力。
基于这个思路,GaussDB(DWS)引入了External schema的概念,通过创建一个External schema,然后以schema.table的方式去访问Hive和Spark的元数据,和正常SQL一致,还可以和GaussDB(DWS)的内表做关联分析,从而使得GaussDB(DWS)的优化器能力和执行引擎能力更强。“未来华为云这边,整个 EI 平台会建立一个Lake Formation的统一存储管理的组件服务,它会统一管起来所有的数仓和数据湖里面的各种组件的元数据,真正实现元数据意义上的共享,元数据的共享是比数据共享难度更高,或者说是真正有更大价值的东西。”华为云数仓GaussDB(DWS)技术专家齐天表示。
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |