python pyspark textFile

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python pyspark textFile相关的知识,希望对你有一定的参考价值。

## Move data between HDF-S and Spark - pyspark
# read some text file
sc.textFile("sqoop_import/departments").take(1)
# looping into a rdd
data=sc.textFile("sqoop_import/departments")
for i in data.collect():
    print(i)
# reading from local fs
sc.textFile("file:///tmp/departments.json").take(3)

以上是关于python pyspark textFile的主要内容,如果未能解决你的问题,请参考以下文章

PySpark textFile 命令中的正则表达式

在 csv 文件中查找行的最大值,同时排除 pyspark 中的标题

PySpark saveAsTextFile 写入的内容与 python Write 写入的内容不同

pySpark加载数据

装饰 SparkContext textFile 过滤行的结果

使用 pyspark 过滤数组中基于 RDD 的值