Hadoop 实验: 熟悉常用的HDFS操作

Posted _大木_

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Hadoop 实验: 熟悉常用的HDFS操作相关的知识,希望对你有一定的参考价值。

文章目录


注意: WARN hdfs.DFSClient: DFSInputStream has been closed already 忽略这个问题就行

1. 利用Hadoop提供的Shell命令完成:

(1)向HDFS中上传任意文本文件,如果指定的文件在HDFS中已经存在,由用户指定是追加到原有文件末尾还是覆盖原有的文件;

cd /usr/local/hadoop
./sbin/start-dfs.sh #启动hadoop

./bin/hdfs dfs -test -e text.txt
echo $?
touch local.txt
./bin/hdfs dfs -appendToFile local.txt text.txt

注意:

	检查文件是否存在: hdfs dfs -test -e text.txt
	(执行完这一句不会输出结果,需要继续输入命令  " echo $?  ")
	追加命令: ./bin/hdfs dfs -appendToFile local.txt text.txt
	覆盖命令1: ./bin/hdfs dfs -copyFromLocal -f local.txt text.txt
	覆盖命令2: ./bin/hdfs dfs -cp -f file:///home/hadoop/local.txt text.txt
也可以使用如下命令实现:
(如下代码可视为一行代码,在终端中输入第一行代码后,直到输入 fi 才会真正执行):
if $(./bin/hdfs dfs -test -e text.txt);
then $(./bin/hdfs dfs -appendToFile local.txt text.txt);
else $(./bin/hdfs dfs -copyFromLocal -f local.txt text.txt);
fi

(2)从HDFS中下载指定文件,如果本地文件与要下载的文件名称相同,则自动对下载的文件重命名;

if $(./bin/hdfs dfs -test -e file:///home/hadoop/text.txt); 
then $(./bin/hdfs dfs -copyToLocal text.txt ./text2.txt); 
else $(./bin/hdfs dfs -copyToLocal text.txt ./text.txt);
 fi

(3)将HDFS中指定文件的内容输出到终端中;

./bin/hdfs dfs -cat text.txt

(4)显示HDFS中指定的文件的读写权限、大小、创建时间、路径等信息;

./bin/hdfs dfs -ls -h text.txt

(5)给定HDFS中某一个目录,输出该目录下的所有文件的读写权限、大小、创建时间、路径等信息,如果该文件是目录,则递归输出该目录下所有文件相关信息;

./bin/hdfs dfs -ls -R -h /user/hadoop

(6)提供一个HDFS内的文件的路径,对该文件进行创建和删除操作。如果文件所在目录不存在,则自动创建目录;

if $(./bin/hdfs dfs -test -d dir1/dir2);
then $(./bin/hdfs dfs -touchz dir1/dir2/filename); 
else $(./bin/hdfs dfs -mkdir -p dir1/dir2 && ./bin/hdfs dfs -touchz dir1/dir2/filename); 
fi

(7)提供一个HDFS的目录的路径,对该目录进行创建和删除操作。创建目录时,如果目录文件所在目录不存在则自动创建相应目录;删除目录时,由用户指定当该目录不为空时是否还删除该目录;

创建目录:./bin/hdfs dfs -mkdir -p dir1/dir2
删除目录:./bin/hdfs dfs -rmdir dir1/dir2 (如果目录非空则会提示not empty,不执行删除)
强制删除目录:./bin/hdfs dfs -rm -R dir1/dir2

(8)向HDFS中指定的文件追加内容,由用户指定内容追加到原有文件的开头或结尾;

`追加到文件末尾`
./bin/hdfs dfs -appendToFile local.txt text.txt
`追加到文件开头: (由于没有直接的命令可以操作,方法之一是先移动到本地进行操作,再进行上传覆盖)`
./bin/hdfs dfs -get text.txt
cat text.txt >> local.txt
./bin/hdfs dfs -copyFromLocal -f text.txt text.txt

(9)删除HDFS中指定的文件;

./bin/hdfs dfs -rm text.txt

(10)删除HDFS中指定的目录,由用户指定目录中如果存在文件时是否删除目录;

`删除目录(如果目录非空则会提示not empty,不执行删除):`
./bin/hdfs dfs -rmdir dir1/dir2
`强制删除目录:`
./bin/hdfs dfs -rm -R dir1/dir2

(11)在HDFS中,将文件从源路径移动到目的路径。

 ./bin/hdfs dfs -mv text.txt text2.txt

以上是关于Hadoop 实验: 熟悉常用的HDFS操作的主要内容,如果未能解决你的问题,请参考以下文章

大数据Hadoop实验报告

大数据Hadoop实验报告

大数据Hadoop实验报告

实验1:熟悉常用的Linux操作和Hadoop操作

实验1:熟悉常用的Linux操作和Hadoop操作

实验1:熟悉常用的Linux操作和Hadoop操作