大数据面试题系列一

Posted 宝哥大数据[离职找工作中,大佬帮内推下]

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据面试题系列一相关的知识,希望对你有一定的参考价值。

Hadoop

Hive

1、Hive-SQL查询连续活跃登录用户思路详解
2、页面停留时长 LEAD 和 LAG

Kafka

Hbase

Spark

1、Spark的Cache和Checkpoint区别和联系
2、Spark 参数调优
3、Spark 数据倾斜
4、GC导致的 Shuffle文件拉取失败

Flink

1、Flink中的Checkpoint和Spark中的Checkpoint区别
2、Flink反压机制及与Spark Streaming的区别

以上是关于大数据面试题系列一的主要内容,如果未能解决你的问题,请参考以下文章