Spark RDD 操作实战之文件读取

Posted 2021-01-24 rhadoop-hive

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Spark RDD 操作实战之文件读取相关的知识，希望对你有一定的参考价值。

/1、本地文件读取
val local_file_1 = sc.textFile("/home/hadoop/sp.txt")
val local_file_2 = sc.textFile("file://home/hadoop/sp.txt")

//2、当前目录下的文件
val file1 = sc.textFile("sp.txt")

//3、HDFS文件
val hdfs_file1 = sc.textFile("hdfs://192.168.66.81:9000/data/input/sp.txt")

//4、多文件读取
val file2 = sc.textFile("sp.txt,a.txt,b.txt")

//5、全目录读取
val hdfs_file2 = sc.textFile("hdfs://192.168.66.81:9000/data/input/")

//6、通配符匹配
val file2 = sc.textFile("file://home/hadoop/*.txt")

//7、读取压缩文件
val file3 = sc.textFile("file://home/hadoop/sp.gz")

以上是关于Spark RDD 操作实战之文件读取的主要内容，如果未能解决你的问题，请参考以下文章