Spark- 常见问题

Posted rzcong

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark- 常见问题相关的知识,希望对你有一定的参考价值。

记录spark使用中常见问题

SparkSQL

日期解析时用到SimpleDateFormat, SimpleDateFormat是线程不安全的。可以使用 FastDateFormat

如:

import org.apache.commons.lang3.time.FastDateFormat

// 输入文件日期时间格式
// [10/Nov/2018:00:01:02 +0800]
val YYYYMMDDHHMM_TIME_FORMAT = FastDateFormat.getInstance("dd/MMM/yyyy:HH:mm:ss Z", Locale.ENGLISH)

 

以上是关于Spark- 常见问题的主要内容,如果未能解决你的问题,请参考以下文章

python+spark程序代码片段

Spark闭包与序列化

Spark:如何加速 foreachRDD?

spark 例子wordcount topk

Spark发现匹配字符串的出现次数

控制 spark-sql 和数据帧中的字段可空性