Ubuntu 16.04 + PyCharm + spark 运行环境配置
Posted birdlove1987
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Ubuntu 16.04 + PyCharm + spark 运行环境配置相关的知识,希望对你有一定的参考价值。
0. 安装PyCharm和spark
下载pycharm http://www.jetbrains.com/pycharm/
下载spark http://spark.apache.org/
ps:在安装pycharm前系统需要有java环境
1.安装py4j
$ sudo pip install py4j
2.配置pycharm
在Run/Debug Configurations中 如下图配置
然后就可以在pycharm中运行pyspark的程序了
测试一下:
from pyspark import SparkContext
sc = SparkContext()
logData = sc.textFile("README.md").cache()
numAs = logData.filter(lambda s: 'a' in s).count()
numBs = logData.filter(lambda s: 'b' in s).count()
print("Lines with a: %i, lines with b: %i" % (numAs, numBs))
运行结果
以上是关于Ubuntu 16.04 + PyCharm + spark 运行环境配置的主要内容,如果未能解决你的问题,请参考以下文章
ubuntu16.04LTS+pycharm kuaijiefangshi
Ubuntu 16.04 + PyCharm + spark 运行环境配置