今天使用Java+Spark 实现 flatMapToPair 的lambda函数,代码如下:
JavaPairRDD<String, String> extractSessionsRDD = time2SessionsRDD.flatMapToPair(tuple->{ List<Tuple2<String, String>> extractSessionids = new ArrayList<>(); // ... return extractSessionids; });
结果报错:
no instance(s) of type variable(s) K2,V2 so that List<Tuple2<String,String>> conforms to Iterator<Tuple2<String,String>>
上网查了下原因,是因为spark 2.0以上要求返回一个Iterator的实例。
于是修改代码如下(标红),错误就消失了。
JavaPairRDD<String, String> extractSessionsRDD = time2SessionsRDD.flatMapToPair(tuple->{
List<Tuple2<String, String>> extractSessionids = new ArrayList<>();
// ...
return extractSessionids.iterator();
});
记录一下,备忘。
参考:http://blog.csdn.net/t1dmzks/article/details/70234272