大数据学习第二章HDFS相关概念

Posted Zero77

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据学习第二章HDFS相关概念相关的知识,希望对你有一定的参考价值。

1、HDFS核心概念:

(1)为了分摊磁盘读写开销也就是大量数据间分摊磁盘寻址开销

(2)HDFS块比普通的文件块大很多,HDFS默认块大小为64MB,普通的只有几千kb

  原因:1、支持面向大规模数据存储

     2、降低分布式节点的寻址开销

  好处:1、支持大规模文件存储(可以将一个大的文件进行切割,放到不同的机器上去存储,这样就可以突破单机存储上限)

     2、简化系统设计

     3、适合数据备份

两大核心组件:

  1、名称节点(NameNode相当于数据目录)

    底层FsImage和各项操作EditLog组成最新元数据

    第二名称节点SecondaryNameNode主要有两个功能

      1、解决EditLog不断增大问题

      2、实现名称节点的冷备份

  2、数据节点(DataNode数据节点)

以上是关于大数据学习第二章HDFS相关概念的主要内容,如果未能解决你的问题,请参考以下文章

大数据HDFS技术干货分享

大数据学习笔记-3-HDFS分布式文件系统

大数据学习架构入门必看,分布式文件系统HDFS解读

大数据相关概念和hdfs

31学习大数据平台 Hadoop 的基本概念和架构,包括 HDFSMapReduce

大数据讲课笔记4.1 HDFS基本概念