HDFS概述

Posted hatcher-h

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了HDFS概述相关的知识,希望对你有一定的参考价值。

hdfs基本特性

hdfs是分布式文件存储系统
hdfs是主从架构
namenode:主节点,用于处理客户端请求,管理元数据
datanode:从节点,存储数据
分块存储:	
		文件过大,就会把一个大文件分为一个个block块。
		一个block块的默认大小是128M
统一命名空间:
		对外提供一个文件访问的地址: hdfs://node01:8020
namonode元数据管理:namenode存储所有的元数据,方便数据查找
副本机制:
		假设一个文件1280M,需要分为10个block块,如果一个block块损坏,那么这个文件就有缺失。
		所有每个block块都有副本进行备份。
hdfs适用于频繁读取,不适用频繁数据写入。
每次数据写入都需要改变元数据。

hdfs操作命令

hdfs dfs -ls [-R] / 
hdfs dfs -mkdir [-R] /test/input
hdfs dfs -put local hdfs  复制
hdfs dfs -moveFromLocal local hdfs 剪贴
hdfs dfs -mv /test/file1 /test/file2
hdfs dfs -cp /test/file /root/
hdfs dfs -appendToFile local hdfs 追加到文件中
hdfs dfs -cat 
hdfs dfs -rm [-r][-f]
hdfs dfs -chown hadoop:hadoop /test
hdfs dfs -chmod -R 777 /test
hdfs dfs -expunge 清空回收站

hdfs高级命令

文件数量限制以及空间大小限制

hdfs dfs -mkdir -p /user/root/lisi     #创建hdfs文件夹
hdfs dfsadmin -setQuota 2 lisi      # 给该文件夹下面设置最多上传两个文件,上传文件,发现只能上传一个文件
hdfs dfsadmin -clrQuota /user/root/lisi    # 清除文件数量限制


hdfs dfsadmin -setSpaceQuota 4k /user/root/lisi   # 限制空间大小4KB
hdfs dfsadmin -clrSpaceQuota /user/root/lisi   #清除空间限额


查看hdfs文件限额数量
hdfs dfs -count -q -h /user/root/lisi

hdfs  dfsadmin  -safemode

安全模式

安全模式下,只能读数据
hdfs集群刚启动的时候,默认30S钟的时间是出于安全期的

基准测试

布好Hadoop后需要测试读写速度
写入速度
向HDFS文件系统中写入数据,10个文件,每个文件10MB,文件存放到
/benchmarks/TestDFSIO中
hadoop jar /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-cdh5.14.0.jar TestDFSIO  -write -nrFiles 10 -fileSize 10MB
正常线上环境写入速度大概20-30M
读取速度
测试hdfs的读取文件性能
在HDFS文件系统中读入10个文件,每个文件10M
hadoop jar /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.6.0-cdh5.14.0.jar TestDFSIO -read -nrFiles 10 -fileSize 10MB
正常读取速度大概50-100M
线上测压
10G 100G 500G 1T 

以上是关于HDFS概述的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop--03---HDFS 概述

大数据-Hadoop生态-HDFS概述

第六章 HDFS概述

HDFS概述数据流

HDFS概述

HDFS概述