spark1 vs spark2 vs spark3
1、spark1引入内存盘算的理念,解决中央结果落盘导致的服从低下。在理想状态下性能可达到MR的100倍。虽然提高了一定的盘算服从,但也带来了大量的内存管理问题,典型的如内存oom问题频发。
2、spark2引入了Tungsten引擎,关键算子服从上比Spark1提拔了10倍。启用“统一内存管理”,不再使用“静态内存管理”,不再使用“静态内存管理”,oom问题大幅下降
3、spark3启用自顺应查询(Adaptive Query Execution)