Spark JDBC伪列不起作用

Question

对于我的用例，我试图使用spark JDBC读取一个大的oracle表。因为，我的表中没有整数类型列，我使用rownum作为paritionColumn。

这是我的spark查询的样子:(对于测试我使用的表只有22000行。）

val df = spark.read.jdbc(jdbcUrl = url, table = select * from table1, 
                         columnName= "rownum", lowerBound = 0, upperBound = 22000, 
                         numPartitions = 3, connectionProperties = oracleProperties)

理想情况下，它应该返回3个分区，每个分区有近7000行。但是当我在数据帧的每个分区上运行计数时，我可以看到只有一个分区有行，而其他分区有0。

df.rdd.mapPartitionsWithIndex{case(i, rows) => Iterator((i, rows.size))}.toDF().show()

输出：

+---+----+
| _1| _2 |    
+---+----+    
| 0 |7332|    
| 1 | 0  |    
| 2 | 0  |    
+---+----+

你能否建议为什么它只在一个分区中返回行？

我的来源是Oracle数据库。使用oracle jdbc驱动程序oracle.jdbc.driver.OracleDriver jar - > ojdbc7.jar

参考线程：http://apache-spark-user-list.1001560.n3.nabble.com/Question-on-using-pseudo-columns-in-spark-jdbc-options-td30154.html