[Nutch]hadoop启用回收站
Posted kandy_ye
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Nutch]hadoop启用回收站相关的知识,希望对你有一定的参考价值。
目前hadoop在默认情况下是没有启用回收站的,如果文件被删除是没有办法恢复的,所以我们需求启用回收站,以便于恢复已经删除的文件。
1. 用hadoop创建一个文件夹
使用如下的命令在hadoop的文件系统里面创建一个文件夹urls:
hadoop fs -mkdir urls
用如下命令进行查看:
hadoop fs -ls
如下:
在web里面也可以查看到:
2. 删掉文件
使用如下命令进行删除:
hadoop fs -rmr urls
提示文件已经被删掉,如下:
在web里面也找不到这个文件了:
3. 启用回收站
需要制定文件被删除后保留的时间,超出这个时间会被自动删除。
我们首先在host1上停止dfs:
stop-dfs.sh
如下:
在host3上停止jobtracker:
stop-mapred.sh
如下:
在conf/core-site.xml里面添加如下内容:
<property>
<name>fs.trash.interval</name>
<value>10080</value>
</property>
如下图:
复制文件到host2和host3上:
scp conf/core-site.xml host2:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml
scp conf/core-site.xml host3:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml
如下图:
4. 验证
启动dfs:
start-dfs.sh
新建文件夹urls:
hadoop fs -mkdir urls
如下:
删除文件夹urls:
hadoop fs -rmr urls
文件urls就被移到回收站了,如下图:
从web管理页面就可以看到回收站目录:.Trash
以上是关于[Nutch]hadoop启用回收站的主要内容,如果未能解决你的问题,请参考以下文章
无法在 Hadoop2 上运行 Nutch2(Nutch 2.x + Hadoop 2.4.0 + HBase 0.94.18 + Gora 0.5 + Avro 1.7.6)