pySpark加载数据

Posted giserpan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了pySpark加载数据相关的知识,希望对你有一定的参考价值。

1、加载本地文件

lines=sc.textFile(‘file:/home/pxy/data/GoodBooks.csv‘)
for line in lines.take(5):
    print line.encode(‘utf-8‘)

效果:

技术分享图片

2、从HDFS加载数据

lines=sc.textFile(‘hdfs://localhost:9000/pxy/film/GoodBooks.csv‘)
TopFive=lines.take(5)
for line in TopFive[1:]:
    print line.encode(‘utf-8‘)

效果:

技术分享图片

 

  

  

 

以上是关于pySpark加载数据的主要内容,如果未能解决你的问题,请参考以下文章

重新加载时刷新片段

用于数据加载的 Android 活动/片段职责

如何在android中将json数据加载到片段中

从 PySpark 加载数据帧

pySpark加载数据

如何使用 ViewPager 显示相同的片段,但每次加载不同的数据?