spark学习第1天

Posted cuijunfeng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark学习第1天相关的知识,希望对你有一定的参考价值。

1.切换目录到/data/目录下,创建名为edu1的目录

  1. cd /data/  
  2. mkdir /data/edu1  

2.切换目录到/data/edu1目录下,使用wget命令,下载webmagic爬虫项目所依赖的lib

  1. cd /data/edu1  
  2. wget http://192.168.1.100:60000/allfiles/second/edu1/webmagic-0.7-libs.tar.gz 

技术图片

 

webmagic-0.7-libs.tar.gz压缩包,解压缩。

  1. tar -xzvf webmagic-0.7-libs.tar.gz  

3.打开eclipse开发工具

 

新建Java Project,命名为pachong1

 

 

点击项目名pachong1,新建一个目录,命名为libs,并将/data/edu1/webmagic-0.7-libs下的所有的jar包,拷贝到libs目录下。并选中所有jar包,右键点击“Build Path” => “Add to Build Path”

 

 技术图片

 

切换目录到/data/edu1/rexian.beijing.gov.cn下,查看数据情况

技术图片

 

 

 

以上是关于spark学习第1天的主要内容,如果未能解决你的问题,请参考以下文章

大三上寒假15天--第1天

[学习笔记]黑马程序员Spark全套视频教程,4天spark3.2快速入门到精通,基于Python语言的spark教程

spark学习02天-scala读取文件,词频统计

大数据Spark学习:Scala基础第一课

掌握Spark机器学习库 大数据开发技能更进一步

Spark寒假自学第二天