免费入驻
产品入驻解决方案入驻公司入驻案例入驻
登录 · 注册
- 只需一步，快速开始
- 账号登录
- 立即注册
- 找回密码
自动登录找回密码

密码立即注册

ToB企服应用市场:ToB评测及商务社交产业平台»论坛 › 大数据 › 数据仓库与分析 › 第一个Spark程序

第一个Spark程序

西河刘卡车医金牌会员 | 昨天 04:18 | 显示全部楼层 | 阅读模式

上一主题

下一主题

楼主

主题 924|帖子 924|积分 2772

一、创建工程

1、创建方式一

创建Maven工程

添加Scala框架

创建Scala文件夹，并设置为源代码文件夹

创建包和对象

2、创建方式二

创建scala工程

添加maven框架

创建scala文件夹，并设置为源代码文件夹

创建包和对象

二、pom.xml添加依赖

<dependencies>
<dependency>
<groupId>org.scala-lang</groupId>
<artifactId>scala-library</artifactId>
<version>2.11.8 </version>
</dependency>
<dependency>
<groupId>org.apache.spark</groupId>
<artifactId>spark-core_2.11</artifactId>
<version>2.4.3</version>
</dependency>
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>3.2.0</version>
</dependency>
</dependencies>

复制代码

三、添加资源文件

在resources目录下创建log4j2.properties,内容如下：

log4j.rootLogger=INFO, stdout
log4j.appender.stdout=org.apache.log4j.ConsoleAppender
log4j.appender.stdout.layout=org.apache.log4j.PatternLayout
log4j.appender.stdout.layout.ConversionPattern=%d %p [%c] - %m%n
log4j.appender.logfile=org.apache.log4j.FileAppender
log4j.appender.logfile.File=target/spring.log
log4j.appender.logfile.layout=org.apache.log4j.PatternLayout
log4j.appender.logfile.layout.ConversionPattern=%d %p [%c] - %m%n

复制代码

四、添加代码如下

package com.soft863
import org.apache.spark.{SparkConf, SparkContext}
object WordCount {
def main(args: Array[String]): Unit = {
//setMaster：指定spark的运行模式，这里指定为本地运行
//local[1]：指定线程数
var conf = new SparkConf().setMaster("local[1]").setAppName("WC")
//打包到linux服务器上执行，或者在windows上执行，需要Hadoop依赖
//conf = new SparkConf().setMaster("spark://master:7077").setAppName("WC")
//创建SparkContext，该对象是提交spark App的入口
val sc = new SparkContext(conf)
excute(sc,"D:\\word.txt","D:\\data\\output1")
}
def excute(sc: SparkContext, source: String, targetFolder: String): Unit = {
sc.textFile(source)
.flatMap(_.split(" "))
.map((_, 1))
.reduceByKey(_ + _)
//指定结果的输出目录，目录不能存在
.saveAsTextFile(targetFolder)
sc.stop()
}
}

复制代码

五、运行程序，查看结果

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

回复

使用道具举报

0 个回复

倒序浏览

快速回复

发新帖回复

西河刘卡车医

金牌会员

这个人很懒什么都没写!

楼主热帖

标签云

存储挺好的服务器

微信订阅号

微信服务号

微信客服

小程序

H5

关于我们商务合作网站地图

快速回复 返回顶部 返回列表