spark sql
Posted 淡季的风
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark sql相关的知识,希望对你有一定的参考价值。
1.rdd to dataframe
rdd.toDF(schema=None, sampleRatio=Non)
session.createDataFrame(data, schema=None, samplingRatio=None, verifySchema=True)
rdd转换为dataframe可以声明schema,也可以设置samplingRatio,让系统自己去猜测数据集的结构。(Error: Some of types cannot be determined by the first 100 rows, please try again with sampling)
2.
以上是关于spark sql的主要内容,如果未能解决你的问题,请参考以下文章