创建DataFrame

Posted guoyu1

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了创建DataFrame相关的知识,希望对你有一定的参考价值。

1、通过case class方式创建

people.txt

技术图片

//定义case class,相当于表结构
case class People(var name:String,var age:Int)
object TestDataFrame1 {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("RDDToDataFrame").setMaster("local")
    val sc = new SparkContext(conf)
    val context = new SQLContext(sc)
    // 将本地的数据读入 RDD, 并将 RDD 与 case class 关联
    val peopleRDD = sc.textFile("E:666people.txt")
      .map(line => People(line.split(",")(0), line.split(",")(1).trim.toInt))
    import context.implicits._
    // 将RDD 转换成 DataFrames
    val df = peopleRDD.toDF
    //将DataFrames创建成一个临时的视图
    df.createOrReplaceTempView("people")
    //使用SQL语句进行查询
    context.sql("select * from people").show()
  }
}

2、通过structType方式创建

 

 

3、通过json文

 

 

参考博客:https://www.cnblogs.com/frankdeng/p/9301743.html

以上是关于创建DataFrame的主要内容,如果未能解决你的问题,请参考以下文章

如何用最少的代码创建过滤后的 DataFrame

webstorm代码片段的创建

创建片段而不从 java 代码实例化它

微信小程序代码片段

如何创建片段以重复变量编号中的代码行

从 Pandas Dataframe 错误创建 Spark DataFrame