当前位置：网站首页>Add spark related dependencies and packaging plugins (sixth bullet)

Add spark related dependencies and packaging plugins (sixth bullet)

2022-08-10 06:54:00 【Insufficient hair volume】

目录
添加sparkrelated dependencies and packaged plugins
步骤1 打开pom.xmlàAdded the following dependencies,点击右下角enable auto-import自动下载
步骤2 右击main下的ScalaCreate a file firstpackage并命名为cn.itcast
步骤3 创建WordCount.scalafile for word frequency statistics alt+回车：Select Import Package
步骤3 创建WordCount.scalafile for word frequency statistics alt+回车：Select Import Package
注意：需要事先在D盘创建word文件夹下的words.txt里面内容如下：（It is best not to use Chinese paths）
解决以上问题,运行结果如下

添加sparkrelated dependencies and packaged plugins

步骤1 打开pom.xmlàAdded the following dependencies,点击右下角enable auto-import自动下载

<!--设置依赖版本号-->

   <properties>

    <scala.version>2.11.8</scala.version>

    <hadoop.version>2.7.1</hadoop.version>

    <spark.version>2.0.0</spark.version>

   </properties>

<dependencies>

    <!--Scala-->

    <dependency>

    <groupId>org.scala-lang</groupId>

    <artifactId>scala-library</artifactId>

    <version>${scala.version}</version>

    </dependency>

<!--Spark-->

    <dependency>

    <groupId>org.apache.spark</groupId>

    <artifactId>spark-core_2.11</artifactId>

    <version>${spark.version}</version>

    </dependency>

    <!--Hadoop-->

    <dependency>

    <groupId>org.apache.hadoop</groupId>

    <artifactId>hadoop-client</artifactId>

    <version>${hadoop.version}</version>

    </dependency>

</dependencies>

Select autoload after adding dependencies

步骤2 右击main下的ScalaCreate a file firstpackage并命名为cn.itcast

步骤3 创建WordCount.scalafile for word frequency statistics alt+回车：Select Import Package

问题：没有scala文件创建选项

解决方法：

After adding the plugin package, you can：

步骤3 创建WordCount.scalafile for word frequency statistics alt+回车：Select Import Package

注意：需要事先在D盘创建word文件夹下的words.txt里面内容如下：（It is best not to use Chinese paths）

package cn.itcast

# 导入包

import org.apache.spark.rdd.RDD   
import org.apache.spark.{SparkConf, SparkContext}
object WordCount {
  def main(args: Array[String]): Unit = {
    //1.创建SparkConf对象,设置appName和Master地址
    val sparkconf = new SparkConf().setAppName("WordCount").setMaster("local[2]")
    //2.创建SparkContext对象,它是所有任务计算的源头,它会创建DAGScheduler和TaskScheduler
    val sparkContext = new SparkContext(sparkconf)
    //设置日志级别
    //sparkContext.setLogLevel("WARN")
    //3.读取数据文件,RDDIt can be simply understood as a collection,集合中存放的元素是String类型
    val data : RDD[String] = sparkContext.textFile("D:\\word\\words.txt")
    //4.切分每一行,获取所有的单词
    val words :RDD[String] = data.flatMap(_.split(" "))
    //5.每个单词记为1,转换为（单词,1）
    val wordAndOne :RDD[(String, Int)] = words.map(x =>(x,1))
    //6.相同单词汇总,前一个下划线表示累加数据,The next underscore indicates new data
    val result: RDD[(String, Int)] = wordAndOne.reduceByKey(_+_)
    //7.收集打印结果数据
    val finalResult: Array[(String, Int)] = result.collect()
    println(finalResult.toBuffer)
    //8.关闭sparkContext对象
    sparkContext.stop()
  }
}

You can see the calculated word frequencyitcast（1）Hadoop（1）spark（1）hello（3）