PythonRDD[1] at RDD at PythonRDD.scala:53

Posted 阿龙的代码在报错

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了PythonRDD[1] at RDD at PythonRDD.scala:53相关的知识,希望对你有一定的参考价值。

运行spark程序时出现以下错误

PythonRDD[1] at RDD at PythonRDD.scala:53

解决方法

原程序代码:

from pyspark import SparkConf,SparkContext
conf = SparkConf().setAppName('filer').setMaster('local[*]')
sc = SparkContext(conf=conf)

rdd = sc.parallelize([1,2,3,4,5,6])
rdd_filer = rdd.filter(lambda x:x>1)
print(rdd_filer)

更改后:

from pyspark import SparkConf,SparkContext
conf = SparkConf().setAppName('filer').setMaster('local[*]')
sc = SparkContext(conf=conf)

rdd = sc.parallelize([1,2,3,4,5,6])
rdd_filer = rdd.filter(lambda x:x>1)
print(rdd_filer.collect())

更改后成功运行

以上是关于PythonRDD[1] at RDD at PythonRDD.scala:53的主要内容,如果未能解决你的问题,请参考以下文章

您可以在 discord.py 中制作更短版本的 member.created_at 吗?

pyspark对应的scala代码PythonRDD对象

大数据框架对比:HadoopStormSamzaSpark和Flink--容错机制(ACK,RDD,基于log和状态快照),消息处理at least once,exactly once两个是关键

模板不存在/错误异常 at-loader.py 第 43 行

Django (v3.1) PASSWORD RESET LINK: AssertionError at line 260 of django/contrib/auth/views.py assert

TemplateDoesNotExist at /polls/ - 在 Django 教程中