通过集合构建RDD或者DataFrame
Posted muyue123
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通过集合构建RDD或者DataFrame相关的知识,希望对你有一定的参考价值。
利用字典构建dataframe。
from pyspark.sql import SparkSession,Row spark = SparkSession.builder.appName("get_app_category").enableHiveSupport().config("spark.driver.host", "localhost").config("spark.debug.maxToStringFields", "100").getOrCreate() dict=[{‘c1‘:‘a‘,‘c2‘:‘b‘},{‘c1‘:‘c‘,‘c2‘:‘d‘}] spark.createDataFrame(dict).show()
以上是关于通过集合构建RDD或者DataFrame的主要内容,如果未能解决你的问题,请参考以下文章