一起使用 ORDER BY 和 GROUP BY

Posted

技术标签:

【中文标题】一起使用 ORDER BY 和 GROUP BY【英文标题】:Using ORDER BY and GROUP BY together 【发布时间】:2012-04-19 07:43:42 【问题描述】:

我的表看起来像这样(我正在使用 mysql):

m_id | v_id | timestamp
------------------------
6    |   1  | 1333635317
34   |   1  | 1333635323
34   |   1  | 1333635336
6    |   1  | 1333635343
6    |   1  | 1333635349

我的目标是对每个 m_id 取一次,并按最高时间戳排序。

结果应该是:

m_id | v_id | timestamp
------------------------
6    |   1  | 1333635349
34   |   1  | 1333635336

我写了这个查询:

SELECT * FROM table GROUP BY m_id ORDER BY timestamp DESC

但是,结果是:

m_id | v_id | timestamp
------------------------
34   |   1  | 1333635323
6    |   1  | 1333635317

我认为这是因为它首先执行 GROUP_BY 然后 ORDER 结果。

有什么想法吗?谢谢。

【问题讨论】:

使用 MAX 从您的组中选择最大值 没有聚合函数的GROUP BY 子句(例如:COUNT(), SUM(), MAX())完全没有意义。 MySQL 甚至允许这样做让我感到困惑。想一想,如果你对组不做任何事情,你为什么要分组? 对“组”的内容进行排序是 MySQL 以前版本中的一个错误。按照 SQL 标准,在这种情况下,ORDER BY 必须只影响GROUP BY 的结果,而不是分组前的数据。 @NullUserException - 没有聚合函数的GROUP BY正确 用法是按主键分组。在您的连接产生 1:many SELECT a.id, a.name, a.age, MAX(b.savings) FROM a INNER JOIN b on a.id = b._id GROUP BY a.id 时很有用 @NullUserException 它允许在使用查找表进行多对多连接时回退。 【参考方案1】:

一种正确使用group by的方法:

select l.* 
from table l
inner join (
  select 
    m_id, max(timestamp) as latest 
  from table 
  group by m_id
) r
  on l.timestamp = r.latest and l.m_id = r.m_id
order by timestamp desc

这是如何工作的:

为子查询中每个不同的m_id 选择最新的时间戳 仅从table 中选择与子查询中的行匹配的行(此操作——执行连接,但没有从第二个表中选择列,它只是用作过滤器——称为"semijoin" 以防你好奇) 对行进行排序

【讨论】:

非常感谢它工作得很好。你能解释一下这个'r'是什么吗?这是一个临时表?在 SQL 中是如何调用的? @luis - 假设子查询是一个视图;内嵌视图。它需要一个名称,以便您可以引用它和它的字段。这个答案将内嵌视图命名为r。你几乎可以称它为任何你喜欢的名字。 @Luis 它是一个别名,您可以通过它引用子查询。我也可以写 (select ...) as r(注意 as)以使其更清楚。 完美运行,但内部连接语句缺少 FROM 子句 感谢@MattFenwick,它对我有用,您节省了我的时间【参考方案2】:

如果您真的不关心您将获得哪个时间戳并且您的v_id 对于给定的m_i 始终相同,您可以执行以下操作:

select m_id, v_id, max(timestamp) from table
group by m_id, v_id
order by max(timestamp) desc

现在,如果给定 m_idv_id 发生变化,那么您应该执行以下操作

select t1.* from table t1
left join table t2 on t1.m_id = t2.m_id and t1.timestamp < t2.timestamp
where t2.timestamp is null
order by t1.timestamp desc

【讨论】:

相信你想在第一个sql块写order by max(timestamp) desc 是的,没错【参考方案3】:

这是最简单的解决方案

select m_id,v_id,max(timestamp) from table group by m_id;

按 m_id 分组,但获取每个 m_id 的最大时间戳。

【讨论】:

【参考方案4】:

你可以试试这个

 SELECT tbl.* FROM (SELECT * FROM table ORDER BY timestamp DESC) as tbl
 GROUP BY tbl.m_id  

【讨论】:

【参考方案5】:

SQL>

SELECT interview.qtrcode QTR, interview.companyname "Company Name", interview.division Division 
FROM interview 
JOIN jobsdev.employer 
    ON (interview.companyname = employer.companyname AND employer.zipcode like '100%')
GROUP BY interview.qtrcode, interview.companyname, interview.division
ORDER BY interview.qtrcode;

【讨论】:

【参考方案6】:

当我一开始试图理解问题和答案时,我感到很困惑。我花了一些时间阅读,我想做一个总结。

    OP 的示例有点误导。 起初我不明白为什么接受的答案是接受的答案..我认为OP的要求可以简单地满足
select m_id, v_id, max(timestamp) as max_time from table
group by m_id, v_id
order by max_time desc

然后我再次查看了接受的答案。我发现实际上 OP 想要表达这一点,例如:

m_id | v_id | timestamp
------------------------
6    |   1  | 11
34   |   2  | 12
34   |   3  | 13
6    |   4  | 14
6    |   5  | 15

他希望根据 (group by)m_id 和 (order by)timestamp 选择所有列

那么上面的sql就不行了。如果你仍然不明白,想象你的列比 m_id | v_id | timestamp 多,例如m_id | v_id | timestamp| columnA | columnB |column C| ...。使用group by,您只能选择那些“分组依据”列并在结果中聚合函数。

到目前为止,您应该已经理解了接受的答案。 另外,请查看 MySQL 8.0 中引入的row_number 函数:

https://www.mysqltutorial.org/mysql-window-functions/mysql-row_number-function/

    查找每个组的前 N ​​行

它的作用与接受的答案类似。

    有些答案是错误的。我的 MySQL 出错了。
select m_id,v_id,max(timestamp) from table group by m_id;

@abinash 萨胡

SELECT m_id,v_id,MAX(TIMESTAMP) AS TIME
 FROM table_name 
 GROUP BY m_id

@Vikas Garhwal

错误信息:

[42000][1055] Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'testdb.test_table.v_id' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by

【讨论】:

【参考方案7】:

为什么要这么复杂?这行得通。

SELECT m_id,v_id,MAX(TIMESTAMP) AS TIME
 FROM table_name 
 GROUP BY m_id

【讨论】:

【参考方案8】:

只需要使用 asc 进行 desc 即可。编写如下查询。它将按升序返回值。

SELECT * FROM table GROUP BY m_id ORDER BY m_id asc;

【讨论】:

那行不通。虽然它会反转结果,但它仍然不会返回所需的结果。

以上是关于一起使用 ORDER BY 和 GROUP BY的主要内容,如果未能解决你的问题,请参考以下文章

GROUP BY 和 ORDER BY一起使用时,要注意的问题!

GROUP BY 和 ORDER BY一起使用

SQL group by 和 order by wherehaving

Group By和Order By的总结

使用group by with order一起查询时间慢

django的group_by