大数据基本操作课程笔记

Posted shi_zi_183

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了大数据基本操作课程笔记相关的知识,希望对你有一定的参考价值。

课程目标

1、安装JDK
2、安装Hadoop
3、安装Eclipse
4、安装winutils
5、安装Hadoop插件

课前环境

在同一网络下有maser,slave1,slave2三个linux服务器,并完成了hadoop集群配置。

所需文件

在这里插入图片描述

安装JDK

运行jdk-8u181-windows-x64
更改安装路径
在这里插入图片描述
JDK安装完成后会自动跳出Jre安装
在这里插入图片描述
在这里插入图片描述

安装Hadoop

我们希望在eclipse脱机调试Map/Reduce代码,所以我们需要在windows下安装hadoop环境。
解压hadoop-3.3.0.tar
移动至安装目录即可
在这里插入图片描述
在这里插入图片描述
添加HADOOP_HOME
我们需要让Map/Reduce知道本地的hadoop路径所以需要将HADOOP路径引入环境变量

安装Eclipse

解压eclipse-jee-neon-3-win32-x86_64移动至安装目录即可
在这里插入图片描述
我的电脑右击->属性->高级系统设置
在这里插入图片描述
添加HADOOP_HOME
在这里插入图片描述
将HADOOP_HOME添加进PATH
在这里插入图片描述

安装winutils hadoop.dll

map/reduce程序以来winutils和hadoop库文件,我们需要将文件放置在system32和hadoop bin目录下

D:\\hadoop-3.3.0\\bin

在这里插入图片描述

C:\\Windows\\System32

在这里插入图片描述

安装hadoop插件

我们要使用eclipse链接hadoop需要相应jar包,这个包要放入eclipse拓展包目录中。
在这里插入图片描述
放入

D:\\eclipse\\dropins

打开eclipse

在这里插入图片描述
修改默认工作目录
window-> Show View -> Other
在这里插入图片描述
在这里插入图片描述
将窗口加入
在这里插入图片描述
右键新建链接
在这里插入图片描述
new Hadoop location
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
这时我们仅能看到目录结构,不能进行下载和更改,因为eclipse默认使用windows用户登录Hadoop,这会导致hadoop驳回请求,所以我们需要修改他的默认用户
在环境变量中加入HADOOP_USER_NAME
在这里插入图片描述

新建项目并运行验证代码

File->New->Other
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在项目下新建包
在这里插入图片描述
在包里新建一个测试文件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在src下新建一个配置文件
在这里插入图片描述
修改配置文件中的eclipse目录
在这里插入图片描述

尝试运行


这个地方不可以直接运行因为代码中使用了main的输入参数,我们需要给出,所以更改run configration
在这里插入图片描述
程序正确的输出了,说明我们配置成功了!!!!
在这里插入图片描述

以上是关于大数据基本操作课程笔记的主要内容,如果未能解决你的问题,请参考以下文章

HTML5期末大作业:餐饮美食网站设计——咖啡(10页) HTML+CSS+JavaScript 学生DW网页设计作业成品 web课程设计网页规划与设计 咖啡网页设计 美食餐饮网页设计...(代码片段

课程笔记大数据处理

清华大学操作系统(陈渝,向勇)课程笔记——虚拟内存

大数据IMF-L38-MapReduce内幕解密听课笔记及总结

AngularJS入门学习笔记一

NTU 课程笔记 CV6422 Statistical Methods & Applications 基本统计知识