我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。相关的知识,希望对你有一定的参考价值。

完全路径名一般是:hdfs://localhost:8000/user/你的用户名/xxxx/xxxx像我的就是hdfs:localhost:8000/user/hadoop/input/test001/yoyo
另外问一下,你用的是hadoop dfs -copyFromLocal命令在terminal里面运行吗?追问

在windows下装的cygwin模拟环境。不过我好想解决了,提示文件不存在是因为我从根目录进去的,但是从hadoop目录中通过./../找到上级目录然后再去找我要上传的本地文件就成功了,虽然我也不知道原因在哪。。。还是很感谢。分给你

追答

哈哈 不用谢! 如果可以的话装一个双系统吧,去ubuntu官网上下一个wubi,然后跟着“下一步”安装就可以了,很方便,有时候cygwin会报一些无厘头的错误~

参考技术A 操作成功了吗,首先要确定上传成功

hadoop单机模式和伪分布式模式的异同

1、运行模式不同:

单机模式是Hadoop的默认模式。这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。

伪分布模式这种模式也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点。

2、配置不同:

单机模式(standalone)首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。

伪分布模式在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。

3、节点交互不同:

单机模式因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。

伪分布模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。

扩展资料:

核心架构:

1、HDFS:

HDFS对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小和复制的块数量在创建文件时由客户机决定。

2、NameNode

NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode 决定是否将文件映射到 DataNode 上的复制块上。

3、DataNode

DataNode 也是在 HDFS实例中的单独机器上运行的软件。Hadoop 集群包含一个 NameNode 和大量 DataNode。DataNode 通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。Hadoop 的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。

参考资料来源:百度百科-Hadoop

参考技术A

一、相同点:

1、运行机器数相同

单机(非分布式)模式与伪分布式都是在一台单机上运行。

二、不同点:

1、分布式文件系统不同

1)、单机(非分布式)模式,没有分布式文件系统,而是直接读写本地操作系统的文件系统。

2)、伪分布式用不同的Java进程模仿分布式运行中的各类结点: (NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode)。

2、启动进程不同

1)、单机(非分布式)模式下,Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程,Map()和Reduce()任务作为同一个进程的不同部分来执行的。

2)、伪分布式模式下,Hadoop启动NameNode、DataNode、JobTracker、TaskTracker这些守护进程都在同一台机器上运行,是相互独立的Java进程。

3、配置文件处理方式不同

1)、单机(非分布式)模式下,不对配置文件进行修改。

2)、伪分布式模式下,修改3个配置文件:core-site.xml(Hadoop集群的特性,作用于全部进程及客户端)、hdfs-site.xml(配置HDFS集群的工作属性)、mapred-site.xml(配置MapReduce集群的属性)。

参考资料

百度百科-Hadoop

参考技术B 可以,hadoop安装分为单机模式,伪分布式模式,完全分布式模式。你装成单机模式或者伪分布式模式就可以了。 单机模式:Hadoop会完全运行在本地。因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程本回答被提问者采纳

以上是关于我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。的主要内容,如果未能解决你的问题,请参考以下文章

Hadoop伪分布式安装之安装JDK如何通过WinSCP将JDK上传到CentOS

Hadoop运行模式:本地模式伪分布模式完全分布模式

hadoop伪分布式安装

hadoop2.2.0伪分布式搭建2--安装JDK

Docker——Hadoop完全分布式安装

hadoop单机模式和伪分布式模式的异同