Apache Spark教程_编程入门自学教程_菜鸟教程-免费教程分享 ...

打印 上一主题 下一主题

主题 1910|帖子 1910|积分 5730

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
教程简介

Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。
Apache Spark入门教程 - 从基本到高级概念的简单步骤了解Apache Spark,其中包括简介,RDD,安装,核心编程,部署,高级Spark编程等示例。
教程目录


  • Apache Spark教程
  • Apache Spark  - 简介
  • Apache Spark  -  RDD
  • Apache Spark  - 安装
  • Apache Spark  - 核心编程
  • Apache Spark  - 部署
  • 高级Spark编程
  • Apache Spark  - 有用的资源

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

惊雷无声

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表