Spark RDD去掉前n行数据

Posted 羲凡丞相

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Spark RDD去掉前n行数据相关的知识,希望对你有一定的参考价值。

@羲凡——只为了更好的活着

Spark RDD去掉前n行数据

Q:在处理一些数据的时候会遇到不想要的前n行,该怎么处理?
A:使用 rddzipWithIndex 算子

rdd.zipWithIndex().filter(_._2>=n).keys  // n换成对应的第几列即可

====================================================================

@羲凡——只为了更好的活着

若对博客中有任何问题,欢迎留言交流

以上是关于Spark RDD去掉前n行数据的主要内容,如果未能解决你的问题,请参考以下文章

Spark DataFrame/RDD 中的前 N ​​个项目

spark总结5 RDD

华农华迪实训训练-获得词频前10的字段数据-requests+Spark RDD

华农华迪实训训练-获得词频前10的字段数据-requests+Spark RDD

将 RDD 中的 JSON 行转换为 Apache Spark 中的数据帧

Spark数据读取