我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。相关的知识,希望对你有一定的参考价值。
完全路径名一般是:hdfs://localhost:8000/user/你的用户名/xxxx/xxxx像我的就是hdfs:localhost:8000/user/hadoop/input/test001/yoyo另外问一下,你用的是hadoop dfs -copyFromLocal命令在terminal里面运行吗?追问
在windows下装的cygwin模拟环境。不过我好想解决了,提示文件不存在是因为我从根目录进去的,但是从hadoop目录中通过./../找到上级目录然后再去找我要上传的本地文件就成功了,虽然我也不知道原因在哪。。。还是很感谢。分给你
追答哈哈 不用谢! 如果可以的话装一个双系统吧,去ubuntu官网上下一个wubi,然后跟着“下一步”安装就可以了,很方便,有时候cygwin会报一些无厘头的错误~
参考技术A 操作成功了吗,首先要确定上传成功hadoop单机模式和伪分布式模式的异同
1、运行模式不同:
单机模式是Hadoop的默认模式。这种模式在一台单机上运行,没有分布式文件系统,而是直接读写本地操作系统的文件系统。
伪分布模式这种模式也是在一台单机上运行,但用不同的Java进程模仿分布式运行中的各类结点。
2、配置不同:
单机模式(standalone)首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,便保守地选择了最小配置。在这种默认模式下所有3个XML文件均为空。当配置文件为空时,Hadoop会完全运行在本地。
伪分布模式在“单节点集群”上运行Hadoop,其中所有的守护进程都运行在同一台机器上。
3、节点交互不同:
单机模式因为不需要与其他节点交互,单机模式就不使用HDFS,也不加载任何Hadoop的守护进程。该模式主要用于开发调试MapReduce程序的应用逻辑。
伪分布模式在单机模式之上增加了代码调试功能,允许你检查内存使用情况,HDFS输入输出,以及其他的守护进程交互。
扩展资料:
核心架构:
1、HDFS:
HDFS对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。存储在 HDFS 中的文件被分成块,然后将这些块复制到多个计算机中(DataNode)。这与传统的 RAID 架构大不相同。块的大小和复制的块数量在创建文件时由客户机决定。
2、NameNode
NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode 决定是否将文件映射到 DataNode 上的复制块上。
3、DataNode
DataNode 也是在 HDFS实例中的单独机器上运行的软件。Hadoop 集群包含一个 NameNode 和大量 DataNode。DataNode 通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。Hadoop 的一个假设是:机架内部节点之间的传输速度快于机架间节点的传输速度。
参考资料来源:百度百科-Hadoop
参考技术A一、相同点:
1、运行机器数相同
单机(非分布式)模式与伪分布式都是在一台单机上运行。
二、不同点:
1、分布式文件系统不同
1)、单机(非分布式)模式,没有分布式文件系统,而是直接读写本地操作系统的文件系统。
2)、伪分布式用不同的Java进程模仿分布式运行中的各类结点: (NameNode,DataNode,JobTracker,TaskTracker,SecondaryNameNode)。
2、启动进程不同
1)、单机(非分布式)模式下,Hadoop不会启动NameNode、DataNode、JobTracker、TaskTracker等守护进程,Map()和Reduce()任务作为同一个进程的不同部分来执行的。
2)、伪分布式模式下,Hadoop启动NameNode、DataNode、JobTracker、TaskTracker这些守护进程都在同一台机器上运行,是相互独立的Java进程。
3、配置文件处理方式不同
1)、单机(非分布式)模式下,不对配置文件进行修改。
2)、伪分布式模式下,修改3个配置文件:core-site.xml(Hadoop集群的特性,作用于全部进程及客户端)、hdfs-site.xml(配置HDFS集群的工作属性)、mapred-site.xml(配置MapReduce集群的属性)。
参考资料
百度百科-Hadoop
以上是关于我做hadoop伪分布式的时候,将本地文件上传到dfs中去,但是老是提示不存在,还请大神帮忙看一下。的主要内容,如果未能解决你的问题,请参考以下文章