这种架构可以实现横向扩展的方式,利用普通主机就可以构建较大规模的集群体系,通过并行化来实现快速的分析任务的快速执行,同时更具有资源优势。
在这个阶段的MPP架构在技能实现基于传统数据库实例举行扩展,比方Greenplum、ADB for PG等都是基于PostgreSQL内核举行开发,在集群中每个节点都是一个独立的数据库实例,具有独立的体系表、用户表等,数据是按照某种策略分布到差别的实例中。客户端在发起请求后由管理节点生成查询计划并举行并行化调度,当涉及到多个节点的数据交换时,比方HashJoin的执行,引入数据交换算子,如下图所示:
在公有云中云数仓以服务的模式来举行交互,降低数据堆栈的管理复杂度,用户将运维、升级等工作交由云厂商来实现,并且以Web的方式来利用数据堆栈服务。目前各种云数仓产物层出不穷,从公有云厂商推出的Google BigQuery、Redshift、Synapse、Snowflake、国内云厂商的阿里云ADB、华为云GaussDB、移动云海山数仓,到近期开源的DataBend、ByConity等,这些产物之间的功能根本相同,只是在技能细节的实现各有差别。
移动云云原生数据库海山数仓产物是中国移动自主研发的云原生分析型(OLAP)数据库。接纳基于 Shared-Data与存储盘算分离架构,具备zero-ETL本事,具备程度在线扩缩容,金融级高可用,提供全面向量化引擎与多种数据源联邦查询等重要特性。兼容 MySQL 协媾和 MySQL 生态。支持海量数据在线查询,复杂查询快速响应,多维数据查询分析等。不仅有力辅助企业客户驾驭复杂的盘算场景与海量数据需求,简化数据流转流程,利用户得以快速洞悉业务运营的真实面貌,而且还能有用资助企业抓住数据时代的战略机遇,驱动业务模式的创新与升级。