大数据选择题牛刀小练2

Posted 闭关苦炼内功

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据选择题牛刀小练2相关的知识,希望对你有一定的参考价值。

大数据选择题牛刀小练2


1、下列哪个属性是hdfs-site.xml中的配置?
A、dfs.replication

2、Hadoop-2.6.5集群中的HDFS的默认的数据块的大小是?
C、128M

3、Hadoop-2.6.5集群中的HDFS的默认的副本块的个数是?
C、3

4、如果我们现有一个安装2.6.5版本的hadoop集群,在不修改默认配置的情况下存储200个每个200M的文本文件,请问最终会在集群中产生多少个数据块(包括副本)?
D、1200

5、以下哪个不是HDFS的守护进程?
C、mrappmaster/yarnchild

6、请问以下哪个命令组成是错误的?
B、sbin/hdfs dfsadmin -report
start, stop相关的命令都在sbin中,
hadoop, hdfs, mapred, yarn 这些集群使用操作命令都在bin目录中

7、以下哪种不是Hive支持的数据类型?
D、Long

8、现在在hadoop集群当中的配置文件中有这么两个配置,请问假如集群当中有一个节点宕机,主节点namenode需要多长时间才能感知到?

dfs.heartbeat.interval
3


heartbeat.recheck.interval
2000

B、34秒

9、下面关于使用hive的描述中不正确的是?
D、hive支持数据删除和修改

10、HDFS集群中的namenode职责不包括?
C、负责保存客户端上传的数据

11、关于HDFS集群中的DataNode的描述不正确的是?
A、DataNode之间都是独立的,相互之间不会有通信
C、一个DataNode上存储的所有数据块可以有相同的

12、HDFS集群中的DataNode的主要职责是?
C、负责保存客户端上传的数据

13、MapReduce的Shuffle过程中哪个操作是最后做的?
D、合并

14、下面关于MapReduce的描述中正确的是?
D、MapReduce程序的默认数据读取组件是TextInputFormat

15、MapReduce编程模型中以下组件哪个是最后执行的?
C、Reducer
MapReduce编程模型中的执行顺序是:
recordReader --> mapper --> partitioner --> reducer

16、在MapReduce中,哪个组件是用户不指定也不会有默认的?
A、Combiner

17、下列哪种类型的文件不是HDFS集群的元数据存储格式?
D、blk_000003425

18、YARN的调度算法不包括以下哪种?
D、Stack Scheduler

19、关于SecondaryNameNode哪项是正确的?
C、它对目的是帮助NameNode合并编辑日志,减少NameNode的负担和冷启动时的加载时间

20、下列关于使用MapReduce编程模型实现SQL中的join操作错误的是?
C、MapJoin也适合各种join场景,也能实现内连接和各种外链接

21、下列哪种业务场景中,不能直接使用Reducer充当Combiner使用?
D、avg求平均

22、下列关于配置机架感知的相关描述哪项不正确?
B、写入数据的时候多个副本会写到不同机架的 DataNode 中

23、Client端上传文件的时候下列哪项正确?
B、Client端将文件切分为 Block,依次上传

24、下列关于HDFS的描述正确的是?
C、NameNode磁盘元数据不保存Block的位置信息

25、一个MapReduce程序中的MapTask的个数由什么决定?
C、FileInputFormat.getSplits(JobContext job)计算出的逻辑切片的数量

26、以下描述错误的是?
D、TextInputFormat的key是指该记录在文件中的行号

27、以下关于新旧 MapReduce API 的描述错误的是?
B、新API倾向于使用接口方式,而旧API倾向于使用抽象类

28、以下描述错误的是?
D、ReduceTask需要等到所有的map输出都复制完才进行Merge

29、以下哪个组件可以指定对key进行Reduce分发的策略?
C、Partitioner

30、执行一个job,如果这个job的输出路径已经存在,那么程序会?
C、抛出一个异常,然后退出

31、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是?
C、一次写入,多次读写

32、Namenode在启动时自动进入安全模式,在安全模式阶段,说法错误的是?
D、文件系统允许有修改

33、MapReduce框架提供了一种序列化机制,支持这种序列化的类能够在Map和Reduce过程中充当键或值,以下说法错误的是?
C、Hadoop的基本类型Text并不实现WritableComparable接口

34、下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是?
B、为实现细粒度并行,输入分片(InputSplit)应该越小越好

35、有关MapReduce的输入输出,说法错误的是?
B、FileInputFormat中实现的getSplits()可以把输入数据划分为分片,分片数目和大小任意定义

36、关于HDFS的文件写入,正确的是?
C、默认将文件块复制成三份分别存放

以上是关于大数据选择题牛刀小练2的主要内容,如果未能解决你的问题,请参考以下文章

大数据选择题牛刀小练4

大数据选择题牛刀小练1

算法题牛刀小试——Fibonacci数列

[前端学习]从0到1做一个Vue风格的Todolist(Vue牛刀小试)

[前端学习]从0到1做一个Vue风格的Todolist(Vue牛刀小试)

牛刀小试之Django二