[Nutch]hadoop启用回收站

Posted kandy_ye

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[Nutch]hadoop启用回收站相关的知识,希望对你有一定的参考价值。

目前hadoop在默认情况下是没有启用回收站的,如果文件被删除是没有办法恢复的,所以我们需求启用回收站,以便于恢复已经删除的文件。

1. 用hadoop创建一个文件夹

使用如下的命令在hadoop的文件系统里面创建一个文件夹urls:

hadoop fs -mkdir urls

用如下命令进行查看:

hadoop fs -ls

如下:
这里写图片描述

在web里面也可以查看到:
这里写图片描述

2. 删掉文件

使用如下命令进行删除:

hadoop fs -rmr urls

提示文件已经被删掉,如下:
这里写图片描述

在web里面也找不到这个文件了:
这里写图片描述

3. 启用回收站

需要制定文件被删除后保留的时间,超出这个时间会被自动删除。
我们首先在host1上停止dfs:

stop-dfs.sh

如下:
这里写图片描述

在host3上停止jobtracker:

stop-mapred.sh

如下:
这里写图片描述

在conf/core-site.xml里面添加如下内容:

<property>
  <name>fs.trash.interval</name>
  <value>10080</value>
</property>

如下图:
这里写图片描述

复制文件到host2和host3上:

scp conf/core-site.xml host2:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml
scp conf/core-site.xml host3:/home/hadoop/workspce/hadoop-1.2.1/conf/core-site.xml

如下图:
这里写图片描述

4. 验证

启动dfs:

start-dfs.sh

这里写图片描述

新建文件夹urls:

hadoop fs -mkdir urls

如下:
这里写图片描述

删除文件夹urls:

hadoop fs -rmr urls

文件urls就被移到回收站了,如下图:
这里写图片描述

从web管理页面就可以看到回收站目录:.Trash
这里写图片描述

以上是关于[Nutch]hadoop启用回收站的主要内容,如果未能解决你的问题,请参考以下文章

nutch+hadoop 配置使用

[Nutch]Hadoop单机伪分布模式的配置

Lucene,Nutch,Hadoop 之间有什么关系?

Lucene,Nutch,Hadoop 之间有什么关系?

无法在 Hadoop2 上运行 Nutch2(Nutch 2.x + Hadoop 2.4.0 + HBase 0.94.18 + Gora 0.5 + Avro 1.7.6)

[Nutch]Hadoop单机伪分布模式的配置