大数据选择题牛刀小练2

Posted 2021-06-30 闭关苦炼内功

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了大数据选择题牛刀小练2相关的知识，希望对你有一定的参考价值。

大数据选择题牛刀小练2

1、下列哪个属性是hdfs-site.xml中的配置？
A、dfs.replication

2、Hadoop-2.6.5集群中的HDFS的默认的数据块的大小是？
C、128M

3、Hadoop-2.6.5集群中的HDFS的默认的副本块的个数是？
C、3

4、如果我们现有一个安装2.6.5版本的hadoop集群，在不修改默认配置的情况下存储200个每个200M的文本文件，请问最终会在集群中产生多少个数据块（包括副本）？
D、1200

5、以下哪个不是HDFS的守护进程？
C、mrappmaster/yarnchild

6、请问以下哪个命令组成是错误的？
B、sbin/hdfs dfsadmin -report
start, stop相关的命令都在sbin中，
hadoop, hdfs, mapred, yarn 这些集群使用操作命令都在bin目录中

7、以下哪种不是Hive支持的数据类型？
D、Long

8、现在在hadoop集群当中的配置文件中有这么两个配置，请问假如集群当中有一个节点宕机，主节点namenode需要多长时间才能感知到？

dfs.heartbeat.interval
3

heartbeat.recheck.interval
2000

B、34秒

9、下面关于使用hive的描述中不正确的是？
D、hive支持数据删除和修改

10、HDFS集群中的namenode职责不包括？
C、负责保存客户端上传的数据

11、关于HDFS集群中的DataNode的描述不正确的是？
A、DataNode之间都是独立的，相互之间不会有通信
C、一个DataNode上存储的所有数据块可以有相同的

12、HDFS集群中的DataNode的主要职责是？
C、负责保存客户端上传的数据

13、MapReduce的Shuffle过程中哪个操作是最后做的？
D、合并

14、下面关于MapReduce的描述中正确的是？
D、MapReduce程序的默认数据读取组件是TextInputFormat

15、MapReduce编程模型中以下组件哪个是最后执行的？
C、Reducer
MapReduce编程模型中的执行顺序是：
recordReader --> mapper --> partitioner --> reducer

16、在MapReduce中，哪个组件是用户不指定也不会有默认的？
A、Combiner

17、下列哪种类型的文件不是HDFS集群的元数据存储格式？
D、blk_000003425

18、YARN的调度算法不包括以下哪种？
D、Stack Scheduler

19、关于SecondaryNameNode哪项是正确的？
C、它对目的是帮助NameNode合并编辑日志，减少NameNode的负担和冷启动时的加载时间

20、下列关于使用MapReduce编程模型实现SQL中的join操作错误的是？
C、MapJoin也适合各种join场景，也能实现内连接和各种外链接

21、下列哪种业务场景中，不能直接使用Reducer充当Combiner使用？
D、avg求平均

22、下列关于配置机架感知的相关描述哪项不正确？
B、写入数据的时候多个副本会写到不同机架的 DataNode 中

23、Client端上传文件的时候下列哪项正确？
B、Client端将文件切分为 Block，依次上传

24、下列关于HDFS的描述正确的是？
C、NameNode磁盘元数据不保存Block的位置信息

25、一个MapReduce程序中的MapTask的个数由什么决定？
C、FileInputFormat.getSplits(JobContext job)计算出的逻辑切片的数量

26、以下描述错误的是？
D、TextInputFormat的key是指该记录在文件中的行号

27、以下关于新旧 MapReduce API 的描述错误的是？
B、新API倾向于使用接口方式，而旧API倾向于使用抽象类

28、以下描述错误的是？
D、ReduceTask需要等到所有的map输出都复制完才进行Merge

29、以下哪个组件可以指定对key进行Reduce分发的策略？
C、Partitioner

30、执行一个job，如果这个job的输出路径已经存在，那么程序会？
C、抛出一个异常，然后退出

31、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的，默认的最基本的存储单位是64M，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是？
C、一次写入，多次读写

32、Namenode在启动时自动进入安全模式，在安全模式阶段，说法错误的是？
D、文件系统允许有修改

33、MapReduce框架提供了一种序列化机制，支持这种序列化的类能够在Map和Reduce过程中充当键或值，以下说法错误的是？
C、Hadoop的基本类型Text并不实现WritableComparable接口

34、下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计，错误的是？
B、为实现细粒度并行，输入分片(InputSplit)应该越小越好

35、有关MapReduce的输入输出，说法错误的是？
B、FileInputFormat中实现的getSplits()可以把输入数据划分为分片，分片数目和大小任意定义

36、关于HDFS的文件写入，正确的是？
C、默认将文件块复制成三份分别存放

以上是关于大数据选择题牛刀小练2的主要内容，如果未能解决你的问题，请参考以下文章