一起使用 ORDER BY 和 GROUP BY
Posted
技术标签:
【中文标题】一起使用 ORDER BY 和 GROUP BY【英文标题】:Using ORDER BY and GROUP BY together 【发布时间】:2012-04-19 07:43:42 【问题描述】:我的表看起来像这样(我正在使用 mysql):
m_id | v_id | timestamp
------------------------
6 | 1 | 1333635317
34 | 1 | 1333635323
34 | 1 | 1333635336
6 | 1 | 1333635343
6 | 1 | 1333635349
我的目标是对每个 m_id 取一次,并按最高时间戳排序。
结果应该是:
m_id | v_id | timestamp
------------------------
6 | 1 | 1333635349
34 | 1 | 1333635336
我写了这个查询:
SELECT * FROM table GROUP BY m_id ORDER BY timestamp DESC
但是,结果是:
m_id | v_id | timestamp
------------------------
34 | 1 | 1333635323
6 | 1 | 1333635317
我认为这是因为它首先执行 GROUP_BY 然后 ORDER 结果。
有什么想法吗?谢谢。
【问题讨论】:
使用MAX
从您的组中选择最大值
没有聚合函数的GROUP BY
子句(例如:COUNT(), SUM(), MAX()
)完全没有意义。 MySQL 甚至允许这样做让我感到困惑。想一想,如果你对组不做任何事情,你为什么要分组?
对“组”的内容进行排序是 MySQL 以前版本中的一个错误。按照 SQL 标准,在这种情况下,ORDER BY
必须只影响GROUP BY
的结果,而不是分组前的数据。
@NullUserException - 没有聚合函数的GROUP BY
的正确 用法是按主键分组。在您的连接产生 1:many SELECT a.id, a.name, a.age, MAX(b.savings) FROM a INNER JOIN b on a.id = b._id GROUP BY a.id
时很有用
@NullUserException 它允许在使用查找表进行多对多连接时回退。
【参考方案1】:
一种正确使用group by
的方法:
select l.*
from table l
inner join (
select
m_id, max(timestamp) as latest
from table
group by m_id
) r
on l.timestamp = r.latest and l.m_id = r.m_id
order by timestamp desc
这是如何工作的:
为子查询中每个不同的m_id
选择最新的时间戳
仅从table
中选择与子查询中的行匹配的行(此操作——执行连接,但没有从第二个表中选择列,它只是用作过滤器——称为"semijoin" 以防你好奇)
对行进行排序
【讨论】:
非常感谢它工作得很好。你能解释一下这个'r'是什么吗?这是一个临时表?在 SQL 中是如何调用的? @luis - 假设子查询是一个视图;内嵌视图。它需要一个名称,以便您可以引用它和它的字段。这个答案将内嵌视图命名为r
。你几乎可以称它为任何你喜欢的名字。
@Luis 它是一个别名,您可以通过它引用子查询。我也可以写 (select ...) as r
(注意 as)以使其更清楚。
完美运行,但内部连接语句缺少 FROM 子句
感谢@MattFenwick,它对我有用,您节省了我的时间【参考方案2】:
如果您真的不关心您将获得哪个时间戳并且您的v_id
对于给定的m_i
始终相同,您可以执行以下操作:
select m_id, v_id, max(timestamp) from table
group by m_id, v_id
order by max(timestamp) desc
现在,如果给定 m_id
的 v_id
发生变化,那么您应该执行以下操作
select t1.* from table t1
left join table t2 on t1.m_id = t2.m_id and t1.timestamp < t2.timestamp
where t2.timestamp is null
order by t1.timestamp desc
【讨论】:
相信你想在第一个sql块写order by max(timestamp) desc
。
是的,没错【参考方案3】:
这是最简单的解决方案
select m_id,v_id,max(timestamp) from table group by m_id;
按 m_id 分组,但获取每个 m_id 的最大时间戳。
【讨论】:
【参考方案4】:你可以试试这个
SELECT tbl.* FROM (SELECT * FROM table ORDER BY timestamp DESC) as tbl
GROUP BY tbl.m_id
【讨论】:
【参考方案5】:SQL>
SELECT interview.qtrcode QTR, interview.companyname "Company Name", interview.division Division
FROM interview
JOIN jobsdev.employer
ON (interview.companyname = employer.companyname AND employer.zipcode like '100%')
GROUP BY interview.qtrcode, interview.companyname, interview.division
ORDER BY interview.qtrcode;
【讨论】:
【参考方案6】:当我一开始试图理解问题和答案时,我感到很困惑。我花了一些时间阅读,我想做一个总结。
-
OP 的示例有点误导。
起初我不明白为什么接受的答案是接受的答案..我认为OP的要求可以简单地满足
select m_id, v_id, max(timestamp) as max_time from table
group by m_id, v_id
order by max_time desc
然后我再次查看了接受的答案。我发现实际上 OP 想要表达这一点,例如:
m_id | v_id | timestamp
------------------------
6 | 1 | 11
34 | 2 | 12
34 | 3 | 13
6 | 4 | 14
6 | 5 | 15
他希望仅根据 (group by
)m_id
和 (order by
)timestamp
选择所有列。
那么上面的sql就不行了。如果你仍然不明白,想象你的列比 m_id | v_id | timestamp
多,例如m_id | v_id | timestamp| columnA | columnB |column C| ...
。使用group by
,您只能选择那些“分组依据”列并在结果中聚合函数。
到目前为止,您应该已经理解了接受的答案。
另外,请查看 MySQL 8.0 中引入的row_number
函数:
https://www.mysqltutorial.org/mysql-window-functions/mysql-row_number-function/
查找每个组的前 N 行
它的作用与接受的答案类似。
-
有些答案是错误的。我的 MySQL 出错了。
select m_id,v_id,max(timestamp) from table group by m_id;
@abinash 萨胡
SELECT m_id,v_id,MAX(TIMESTAMP) AS TIME
FROM table_name
GROUP BY m_id
@Vikas Garhwal
错误信息:
[42000][1055] Expression #2 of SELECT list is not in GROUP BY clause and contains nonaggregated column 'testdb.test_table.v_id' which is not functionally dependent on columns in GROUP BY clause; this is incompatible with sql_mode=only_full_group_by
【讨论】:
【参考方案7】:为什么要这么复杂?这行得通。
SELECT m_id,v_id,MAX(TIMESTAMP) AS TIME
FROM table_name
GROUP BY m_id
【讨论】:
【参考方案8】:只需要使用 asc 进行 desc 即可。编写如下查询。它将按升序返回值。
SELECT * FROM table GROUP BY m_id ORDER BY m_id asc;
【讨论】:
那行不通。虽然它会反转结果,但它仍然不会返回所需的结果。以上是关于一起使用 ORDER BY 和 GROUP BY的主要内容,如果未能解决你的问题,请参考以下文章
GROUP BY 和 ORDER BY一起使用时,要注意的问题!