spark在hdfs新建文件并写入内容

Posted 健忘主义

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark在hdfs新建文件并写入内容相关的知识,希望对你有一定的参考价值。

val hdfs: FileSystem = org.apache.hadoop.fs.FileSystem.get(new org.apache.hadoop.conf.Configuration())
//spark中使用 val hdfs: FileSystem =  FileSystem.get(spark.sparkContext.hadoopConfiguration)
val out = hdfs.create(new Path(s"hdfs://$filePath/$ph.name/人脸多档对应的抓拍集合.html"),true) // 第二个参数true 表示覆盖同名文件

// 适合少量数据
df_face_html.collect().foreach
            ph => if (ph.urls.nonEmpty) 
                out.write(ph.urls.get.getBytes) //中文不乱码 文本顶部无异常字符 
            
        

out.flush()
out.close()

case class personHtml(name:String,urls:Option[String])

以上是关于spark在hdfs新建文件并写入内容的主要内容,如果未能解决你的问题,请参考以下文章

Spark Streaming实时处理

Spark Streaming实时处理

如何将使用 Pandas 在 Spark 集群上编写的文件移动到 HDFS?

无法在 Spark 中将文件写入 Zeppelin 上的远程 hdfs

配置 Spark 写入 HDFS 的 Avro 文件大小

将 Spark Streaming 输出写入 HDFS 时跳过数据