当两个ID在Scala中具有相同的最高价格时,以较小的ID获得最高价格

Posted

技术标签:

【中文标题】当两个ID在Scala中具有相同的最高价格时,以较小的ID获得最高价格【英文标题】:Get the highest price with smaller ID when two ID have the same highest price in Scala 【发布时间】:2019-03-13 02:40:31 【问题描述】:

我有一个名为 productPrice 的数据框,它有列 ID 和价格,我想获取价格最高的 ID,如果两个 ID 的最高价格相同,我只获取 ID 号较小的那个。我用

val highestprice = productPrice.orderBy(asc("ID")).orderBy(desc("price")).limit(1) 但是我得到的结果不是 ID 较小的,而是 ID 较大的。我不知道我的逻辑有什么问题,知道吗?

【问题讨论】:

【参考方案1】:

试试这个。

scala> val df = Seq((4, 30),(2,50),(3,10),(5,30),(1,50),(6,25)).toDF("id","price")
df: org.apache.spark.sql.DataFrame = [id: int, price: int]

scala> df.show
+---+-----+
| id|price|
+---+-----+
|  4|   30|
|  2|   50|
|  3|   10|
|  5|   30|
|  1|   50|
|  6|   25|
+---+-----+


scala> df.sort(desc("price"), asc("id")).show
+---+-----+
| id|price|
+---+-----+
|  1|   50|
|  2|   50|
|  4|   30|
|  5|   30|
|  6|   25|
|  3|   10|
+---+-----+

【讨论】:

【参考方案2】:

使用 Spark SQL 解决同样的问题:

val df = Seq((4, 30),(2,50),(3,10),(5,30),(1,50),(6,25)).toDF("id","price")

df.createOrReplaceTempView("prices")

--

%sql
SELECT id, price
FROM prices
ORDER BY price DESC, id ASC
LIMIT(1)

【讨论】:

以上是关于当两个ID在Scala中具有相同的最高价格时,以较小的ID获得最高价格的主要内容,如果未能解决你的问题,请参考以下文章

NonUniqueDiscoveredSqlAliasException 当两个表具有相同的列名时

当两个字段具有相同的id时,jQuery远程验证不起作用

如何找到最高和最低的产品价格

什么时候在 Scala 中使用 SBT 和 Ivy 模糊地选择了具有相同定义和类路径的两个类?

如何使用 Thrust 库以较低的精度对键进行排序

SQL 计算具有相同 sub_id 的两个值的百分比。