[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子相关的知识,希望对你有一定的参考价值。
[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子
from pyspark.sql.types import *
schema = StructType( [ StructField("age",IntegerType(),True),
StructField("name",StringType(),True),
StructField("pcode",StringType(),True) ] )
myrdd = sc.parallelize([(40,"Abram","01601"),(16,"Lucia","87501")])
mydf = sqlContext.createDataFrame(myrdd,schema)
mydf.limit(5).show()
+---+-----+-----+
|age| name|pcode|
+---+-----+-----+
| 40|Abram|01601|
| 16|Lucia|87501|
+---+-----+-----+
以上是关于[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子的主要内容,如果未能解决你的问题,请参考以下文章
[Spark][Python][RDD][DataFrame]从 RDD 构造 DataFrame 例子
[Spark][Python][DataFrame][RDD]DataFrame中抽取RDD例子