用Python写Spark的时候路过的坑
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用Python写Spark的时候路过的坑相关的知识,希望对你有一定的参考价值。
1 没法按行去遍历RDD(因为我要做两次循环去比较) 没解决
2 pandas dataframe 转 pysparks.sql 的dataframe http://blog.csdn.net/zhurui_idea/article/details/72981715
3 dataframe 转 RDD http://blog.csdn.net/zhurui_idea/article/details/73090951
TO BE CONTINUED
以上是关于用Python写Spark的时候路过的坑的主要内容,如果未能解决你的问题,请参考以下文章