曂沅仴駦 发表于 2025-3-28 04:01:20

一分钟了解Spark

Spark简介

概述

Apache Spark是用于大规模数据分析的统一引擎。是一个分布式内存盘算框架。
大规模数据:海量数据。
分析:处置惩罚、盘算。
统一引擎:支持多种语言、多种模式运行。
商业版Spark: 提到Spark,就不得不提databrick公司,俗称砖厂,是由UC Berkeley实行室的成员创立的公司,也是Spark背后的商业公司。
Databrick官网:Learn About Databricks Spark | Databricks
如下:
https://i-blog.csdnimg.cn/direct/c41ffcfa5e544f8d84dd4c6e5f13da51.pnghttps://i-blog.csdnimg.cn/direct/be68f818fa444e138ca9e07304f6ac28.gif
与开源Spark相比: 比开源Spark块了5倍
https://i-blog.csdnimg.cn/direct/1475b684cbe749879af0a0bad753e25d.pnghttps://i-blog.csdnimg.cn/direct/efe14bcc82044722ac1dbaac3c7278c7.gif

Apache官网首页:Apache Spark™ - Unified Engine for large-scale data analytics
如下:


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 一分钟了解Spark