row_number() over(partition by 列名1 order by 列名2 ) 实际应用
Posted 双鱼数据
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了row_number() over(partition by 列名1 order by 列名2 ) 实际应用相关的知识,希望对你有一定的参考价值。
表示根据 列名1 分组,然后在分组内部根据 列名2 排序,而此函数计算的值就表示每组内部排序后的顺序编号,可以用于去重复值
与rownum的区别在于:使用rownum进行排序的时候是先对结果集加入伪列rownum然后再进行排序,而此函数在包含排序从句后是先排序再计算行号码.
---查询所有姓名,如果同名,则按年龄降序
SELECT NAME,AGE,DETAIL,ROW_NUMBER() OVER(PARTITION BY NAME ORDER BY AGE DESC) FROM TEST_Y;
通过上面的语句可知,是按照NAME字段分组,按AGE字段排序的。 如果只需查询出不重复的姓名即可,则可使用如下的语句, 由查询结果可知,姓名相同年龄小的数据被过滤掉了;
SELECT * FROM (SELECT NAME,AGE,DETAIL,ROW_NUMBER()OVER(PARTITION BY NAME ORDER BY AGE DESC )RN FROM TEST_Y) WHERE RN= 1 ;
--先做一个子查询,先按id1进行排序,排序完后,给每条记录进行了编号
--然后再将子查询做为一张表,就可以进行分页了
--取前二
SELECT *
FROM (SELECT T.*,ROW_NUMBER() OVER(ORDER BY T.ID1 ASC) RN FROM DEMO T) D
WHERE D.RN BETWEEN 1 AND 2 ;
以上是关于row_number() over(partition by 列名1 order by 列名2 ) 实际应用的主要内容,如果未能解决你的问题,请参考以下文章
Spark2 DataFrame数据框常用操作之分析函数--排名函数row_number,rank,dense_rank,percent_rank