如何避免火花提交缓存

Posted

技术标签:

【中文标题】如何避免火花提交缓存【英文标题】:how to avoid spark-submit cache 【发布时间】:2016-11-13 22:38:31 【问题描述】:

spark-submit 作业放在 CDH 中,有一件奇怪的事情。它总是抱怨一个查询(下面的XXX),但这个查询不在当前应用程序中,它是一个旧查询,之前使用过它并被删除。看起来某处有一些缓存。

代码很简单,var extract = sqlContext.sql(".....")

如何解决?谢谢。

16/11/13 22:12:29 INFO DAGScheduler: Job 1 finished: aggregate at InferSchema.scala:41, took 3.032230 s
Exception in thread "main" org.apache.spark.sql.AnalysisException: cannot resolve 'XXX' (string and boolean).;
        at org.apache.spark.sql.catalyst.analysis.package$AnalysisErrorAt.failAnalysis(package.scala:42)
        at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$$anonfun$checkAnalysis$1$$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:61)
        at org.apache.spark.sql.catalyst.analysis.CheckAnalysis$$anonfun$checkAnalysis$1$$anonfun$apply$2.applyOrElse(CheckAnalysis.scala:53)
        at org.apache.spark.sql.catalyst.trees.TreeNode$$anonfun$transformUp$1.apply(TreeNode.scala:293)

谢谢。

【问题讨论】:

【参考方案1】:

您可能需要删除旧 jar 并重建它以执行。

【讨论】:

以上是关于如何避免火花提交缓存的主要内容,如果未能解决你的问题,请参考以下文章

火花避免收集尽可能

PHP清除浏览器缓存以避免刷新后重新发送表单数据

谷歌云存储:我如何避免边缘缓存

避免在 Relay 中缓存

三阶段提交如何避免阻塞?

PHP避免刷新页面重复提交