[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子相关的知识,希望对你有一定的参考价值。

[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子

from pyspark.sql.types import *

schema = StructType( [ StructField("age",IntegerType(),True),
StructField("name",StringType(),True),
StructField("pcode",StringType(),True) ] )

myrdd = sc.parallelize([(40,"Abram","01601"),(16,"Lucia","87501")])

mydf = sqlContext.createDataFrame(myrdd,schema)

mydf.limit(5).show()

+---+-----+-----+
|age| name|pcode|
+---+-----+-----+
| 40|Abram|01601|
| 16|Lucia|87501|
+---+-----+-----+

 

以上是关于[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子的主要内容,如果未能解决你的问题,请参考以下文章

如何在已应用于 Spark RDD 的函数中打印语句?

[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子

实验4 RDD编程初级实践

[Spark][Python][DataFrame][RDD]DataFrame中抽取RDD例子

[Spark][Python][DataFrame][RDD]从DataFrame得到RDD的例子

如何在spark(Python)中将两个rdd组合成on rdd