大数据面试题

Posted 黑冰vip

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据面试题相关的知识,希望对你有一定的参考价值。

一.SQL 

1、查询出每门课程的及格人数和不及格人数

2、使用分段[100-80],[80-60][‹60]来统计各科成绩,分别统计:各分数段人数,课程号和课程名称

3、下面是学生的成绩表(表名score,列名:学号、课程号、成绩)

5.查询没有学全所有课的学生的学号、姓名

6.查询两门以上不及格课程的同学的学号及其平均成绩

二、Hadoop

1、hadoop数据倾斜如何处理

2、Hadoop性能调优

 3、hadoop常见的join

 

  

三、hive 

1、 hive中两个大表实现join操作,简单描述。

 2、 hive中排序关键字有哪些? 

3、 hive数据倾倾斜,如何处理?

 四、Spark

 1、RDD机制以及存储级别?

 2、 检查点机制 

 3、 Spark 的工作流程

以上是关于大数据面试题的主要内容,如果未能解决你的问题,请参考以下文章

LeetCode Algorithm 面试题 16.10. 生存人数

Java面试题总结之数据库与SQL语句

程序员面试金典-面试题 16.10. 生存人数

面试题 16.10. 生存人数

面试题 16.10. 生存人数

50道SQL面试题