spark在hdfs新建文件并写入内容
Posted 健忘主义
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark在hdfs新建文件并写入内容相关的知识,希望对你有一定的参考价值。
val hdfs: FileSystem = org.apache.hadoop.fs.FileSystem.get(new org.apache.hadoop.conf.Configuration())
//spark中使用 val hdfs: FileSystem = FileSystem.get(spark.sparkContext.hadoopConfiguration)
val out = hdfs.create(new Path(s"hdfs://$filePath/$ph.name/人脸多档对应的抓拍集合.html"),true) // 第二个参数true 表示覆盖同名文件
// 适合少量数据
df_face_html.collect().foreach
ph => if (ph.urls.nonEmpty)
out.write(ph.urls.get.getBytes) //中文不乱码 文本顶部无异常字符
out.flush()
out.close()
case class personHtml(name:String,urls:Option[String])
以上是关于spark在hdfs新建文件并写入内容的主要内容,如果未能解决你的问题,请参考以下文章
如何将使用 Pandas 在 Spark 集群上编写的文件移动到 HDFS?