求大佬指点:

Posted weixin_45482658

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了求大佬指点:相关的知识,希望对你有一定的参考价值。

spark之word count,sc.txtFile时输入本地path...\\\\input\\\\1.txt能正常运行,但输入path...\\\\input时却报错(input下有1.txth和2.txt)

package study.spark_test

import org.apache.spark.rdd.RDD
import org.apache.spark.SparkConf, SparkContext

/**
  * @Author Dai Y.H.
  * @Date 2023/2/26 15:12
  * @PackageName:com.spark_test
  * @ClassName: WordCount
  * @Description: TODO
  * @Version 1.0
  */
object WordCount 
  def main(args: Array[String]): Unit = 
    /*
        * Spark本身集群的资源管理 Master 和 Worker
        * 计算driver和executor
        * sparkcontext是连接上下文的 在driver里面
        * */
    //1.环境配置
    val conf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("WordCount")
    //2.SparkContext连接上下文
    val sc: SparkContext = new SparkContext(conf)
    //3.读取文件数据
    val data: RDD[String] = sc.textFile("E:\\\\IDEA_Projects\\\\dyh_bigdata\\\\input")
    //4.扁平化
    val flatmap: RDD[String] = data.flatMap(_.split(" "))
    //5.数据(key,value)
    val map: RDD[(String, Int)] = flatmap.map((_,1))
    //6.计算分组聚合
    val reduce: RDD[(String, Int)] = map.reduceByKey(_+_)
    //7.输出
    reduce.foreach(println(_))
  

以上是关于求大佬指点:的主要内容,如果未能解决你的问题,请参考以下文章

急急急 pyqt5 matplotlib 多线程问题,求大佬指点啊

用idea编写java代码时突然出现的问题求大佬指点

Spark求平均成绩–Scala

IDEA使用Maven打包Spark项目报错,求大神指点下

Scala Map的一个方法,根据设备编号查找并返回,求大佬帮忙写方法代码

python3 请求网页时得到空的json里面的data数据为空,加了headers,为什么还会这样,求大佬指点