数据库使用order by排序乱序的问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据库使用order by排序乱序的问题相关的知识,希望对你有一定的参考价值。

参考技术A 数据分页时需要根据数据记录创建时间create_time字段倒序,即使用order by create_time desc,但是我们会发现,前端进行请求时获取的数据并不正确,分页中出现了一定的重复数据。
由于大量数据是并发创建的,所以create_time字段值是相同的。这里会有一个很有趣的问题,当order by的字段相同的时候 系统对数据的排序可能变得随机,即一会儿这条数据在前面,一会儿这条数据在后面了 ,所以当翻页的时候我们很容易便看到了重复的数据。
查阅了Goole和相关资料,大概总结了这种情况的原因。其实发生这种现象是“故意”设计的。
  如果没有指定ORDER BY语句,则SQL Server(或任何RDBMS)不保证以特定顺序返回结果。 有些人认为,如果没有指定order by子句,行总是以聚簇索引顺序或物理磁盘顺序返回。 然而,这是不正确的,因为在查询处理期间可以改变行顺序的许多因素,例如并行的HASH连接是更改行顺序的操作符的一个很好的例子。
  如果指定ORDER BY语句,SQL Server将对行进行排序,并按请求的顺序返回。 但是,如果该顺序不是确定性的,即可能有重复的值,则在每个具有相同值的组中,由于与上述相同的原因,该顺序是“随机的”。
  确保确定性顺序的唯一方法是在ORDER BY子句中包含保证的唯一列或列组(例如主键)。

避坑,Oracle中rownum与order by的执行顺序

「场景分析」

今天遇到这样一个场景:在列表展示数据的时候,使用rownum进行分页,并用order by 对某些字段进行排序。

于是写出了下面的模拟查询sql:

select rownum rn, t.*  from sys_dept t order by t.dept_name desc ;

从上面的截图中可以发现:

rownum完全是乱序的,因此最终以这种方式分页排序获取的数据列表不能达到预期的效果。

「原因分析」

  • 若order by 的基准字段是表的PrimaryKey,则查询执行过程是先对表进行排序,然后为排序后的表视图从第一行到最后一行赋予rownum值。

  • 反之,如果order by的基准字段不是PK,则先从第一行到最后一行为表赋予ROWNUM值,然后进行order by排序。

「解决方法」

先对排序字段进行order by,然后再赋rownum值;即在外面先包一层,再赋予rownum值即可;最终根据rownum分页即可。

 select rownum rn, tt.*from (select t.* from sys_dept t order by t.dept_name desc) tt;

以上是关于数据库使用order by排序乱序的问题的主要内容,如果未能解决你的问题,请参考以下文章

php 网页 order by 排序无效

scrapy爬下来的数据是乱序的,如何排序?

算法创作 | 冒泡排序问题解决方法

Mysql group by,order by,dinstict优化

在索引 501 处获取的对象有一个乱序的部分名称“应用物理学杂志”。对象必须按部分名称排序'

Hive学习 排序:order bysort bydistribute bycluster by