从spark写入elasticsearch非常慢

Question

我正在处理一个文本文件，并将转换后的行从Spark应用程序写入弹性搜索

input.write.format("org.elasticsearch.spark.sql")
      .mode(SaveMode.Append)
      .option("es.resource", "{date}/" + dir).save()

这运行速度非常慢，大约需要8分钟才能写入287.9 MB / 1513789条记录。

如果网络延迟始终存在，我如何调整spark和elasticsearch设置以使其更快。

我在本地模式下使用spark，有16个内核和64GB RAM。我的elasticsearch集群有一个主节点和3个数据节点，每个节点有16个核心和64GB。

我正在阅读如下文本文件

 val readOptions: Map[String, String] = Map("ignoreLeadingWhiteSpace" -> "true",
  "ignoreTrailingWhiteSpace" -> "true",
  "inferSchema" -> "false",
  "header" -> "false",
  "delimiter" -> "	",
  "comment" -> "#",
  "mode" -> "PERMISSIVE")

....

val input = sqlContext.read.options(readOptions).csv(inputFile.getAbsolutePath)