bayaim_hadoop2_hdfs_20181107

Posted 上帝_BayaiM

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bayaim_hadoop2_hdfs_20181107相关的知识,希望对你有一定的参考价值。

------------------bayaim_bayaim_hadoop2_hdfs_20181107---------------------------------

HDFS 原理:上传数据要分块(128M)分块存储
分布式文件系统
---------先启动HDFS----------------
1. sbin/start-dfs.sh
一直输入:yes
电脑密码: root/dba_2018
-----------再启动YARN-----------
2. sbin/start-yarn.sh
3 验证是否启动成功
# jps ------------------------------
使用jps命令验证
27408 NameNode ----hdfs 的老大
28218 Jps ----java 相关的命令
27643 SecondaryNameNode ----hdfs 的助理,帮助数据同步
28066 NodeManager ----YARN 的小弟
27803 ResourceManager ----YARN 的老大,资源的分配 调度
27512 DataNode ----hdfs 的小弟
[[email protected] sbin]# ./stop-all.sh ---------------------------------

This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [testoracle]
testoracle: stopping namenode
localhost: stopping datanode
Stopping secondary namenodes [0.0.0.0]
0.0.0.0: stopping secondarynamenode
stopping yarn daemons
stopping resourcemanager
localhost: stopping nodemanager
no proxyserver to stop

[[email protected] sbin]# ./start-dfs.sh ---------------------------------
[[email protected] sbin]# hadoop fs -ls hdfs://testoracle:9000/
[[email protected] sbin]# hadoop fs -copyFromLocal /home/oracle/import.log /import.log (管道,进行分页)
[[email protected] ~]# hadoop fs -ls -R /
[[email protected] ~]# hdfs dfs -ls -R /
[[email protected] hadoop-2.2.0]# hadoop fs -chgrp root /import.log
[[email protected] hadoop-2.2.0]# hadoop fs -ls /

http://192.168.210.82:50070 (HDFS管理界面)
http://192.168.210.82:8088 (MR管理界面YARN)

1.元数据 : 文件存了几个副本 、 有几块、 在哪台机器上(账本,数据的描述信息,namenode metadata)
2.数据:datanodes 怎么知道文件损坏:校验核 、 MD5值 算法(每个文件是唯一的)大数据采用C32 校验机制

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 



































以上是关于bayaim_hadoop2_hdfs_20181107的主要内容,如果未能解决你的问题,请参考以下文章

大数据技术之_04_Hadoop学习_01_HDFS_HDFS概述+HDFS的Shell操作(开发重点)+HDFS客户端操作(开发重点)+HDFS的数据流(面试重点)+NameNode和Seconda

大数据技术之_04_Hadoop学习_02_HDFS_DataNode(面试开发重点)+HDFS 2.X新特性

合集Hadoop 合集

Hadoop 2.7.6_03_HDFS原理

10_Azkaban案例实践3_Command操作HDFS

大数据技术之_05_Hadoop学习_04_MapReduce_Hadoop企业优化(重中之重)+HDFS小文件优化方法+MapReduce扩展案例+倒排索引案例(多job串联)+TopN案例+找博客