寒假学习进度-2

Posted liujinxin123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了寒假学习进度-2相关的知识,希望对你有一定的参考价值。

Spark的安装和使用

安装的是spark-2.1.0-bin-without-hadoop.tgz

修改了Spark的配置文件spark-env.sh

添加了配置信息:

export SPARK_DIST_CLASSPATH=$(/usr/local/hadoop/bin/hadoop classpath)

Spark的使用

在终端中首先要切换到Spark的目录

cd /usr/local/spark

之后通过输入

bin/spark-shell进入编辑模式

如果需要用到HDFS还需要启动Hadoop

读取本地文件

val textFile=sc.textFile("file:///home/hadoop/test.txt") 

在 spark-shell 中读取 HDFS 系统文件

val textFile=sc.textFile("hdfs://localhost:9000/user/hadoop/test.txt") 

以上是关于寒假学习进度-2的主要内容,如果未能解决你的问题,请参考以下文章

寒假学习进度-2

2020年寒假第5次学习进度记录

2020年寒假学习进度第二天

2020寒假学习进度报告2

2020年寒假学习进度第十天

寒假学习进度-3