Ubuntu 16.04 + PyCharm + spark 运行环境配置

Posted birdlove1987

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu 16.04 + PyCharm + spark 运行环境配置相关的知识,希望对你有一定的参考价值。

0. 安装PyCharm和spark

      下载pycharm   http://www.jetbrains.com/pycharm/

      下载spark          http://spark.apache.org/

       ps:在安装pycharm前系统需要有java环境

1.安装py4j

       $ sudo pip install py4j

2.配置pycharm

       在Run/Debug Configurations中 如下图配置

 



然后就可以在pycharm中运行pyspark的程序了

测试一下:


from pyspark import SparkContext

sc = SparkContext()

logData = sc.textFile("README.md").cache()

numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()

print("Lines with a: %i, lines with b: %i" % (numAs, numBs))

运行结果



以上是关于Ubuntu 16.04 + PyCharm + spark 运行环境配置的主要内容,如果未能解决你的问题,请参考以下文章

ubuntu16.04LTS+pycharm kuaijiefangshi

Ubuntu16.04下Pycharm2018安装

ubuntu16.04 pycharm的安装

Ubuntu 16.04 + PyCharm + spark 运行环境配置

Ubuntu 16.04 + PyCharm + spark 运行环境配置

ubuntu16.04 安装pycharm anaconda