通过分组选择最大日期?
Posted
技术标签:
【中文标题】通过分组选择最大日期?【英文标题】:Select max date by grouping? 【发布时间】:2015-05-30 18:07:33 【问题描述】:请有人帮忙吗?我已经在这个愚蠢的问题上投入了 HOURS 时间。 This stackoverview post 完全是我的问题,我尝试了两种建议的解决方案均无济于事。
这是我的具体情况。我从我的实际数据库中提取了 4 条记录,并且没有排除任何字段:
master_id date_sent type mailing response
00001 2015-02-28 00:00:00 PHONE NULL NULL
00001 2015-03-13 14:45:20 EMAIL ThankYou.html NULL
00001 2015-03-13 14:34:43 EMAIL ThankYou.html NULL
00001 2015-01-11 00:00:00 EMAIL KS_PREVIEW TRUE
00001 2015-03-23 21:42:03 EMAIL MailChimp Update #2 NULL
(对不起,列的对齐方式。)
我想获取每个 master_id 的最新邮件和 date_sent。 (为了简化这篇文章,我的摘录只有一个 master_id。)
所以我运行这个查询:
SELECT master_id,date_sent,mailing
FROM contact_copy
WHERE type="EMAIL"
并得到预期的结果:
master_id date_sent mailing
1 3/13/2015 14:45:20 ThankYou.html
1 3/13/2015 14:34:43 ThankYou.html
1 1/11/2015 0:00:00 KS_PREVIEW
1 3/23/2015 21:42:03 MailChimp Update #2
但是,当我添加这个简单的聚合来获取最近的日期时:
SELECT master_id,max(date_sent),mailing
FROM contact_copy
WHERE type="EMAIL"
group BY master_id
;
我得到了一个意想不到的结果:
master_id max(date_sent) mailing
00001 2015-03-23 21:42:03 ThankYou.html
所以我的问题是:为什么它会返回错误的邮件?
这让我发疯了!谢谢。
顺便说一句,我不是开发人员,如果我违反了一些询问的礼仪规则,我很抱歉。 :)
【问题讨论】:
【参考方案1】:由于 mysql 对 GROUP BY
功能的特定扩展,您会得到“意外”结果。根据 MySQL 参考手册,您得到的结果实际上是预期的。
参考:https://dev.mysql.com/doc/refman/5.5/en/group-by-handling.html
其他数据库引擎会将您的查询视为无效而拒绝...类似“non-aggregate expressions included in the SELECT list not included in the GROUP BY
”的错误。)
如果我们在 SQL 模式中包含 ONLY_FULL_GROUP_BY
,我们可以让 MySQL 像其他数据库一样运行(并为该查询返回错误)。
参考:https://dev.mysql.com/doc/refman/5.5/en/sql-mode.html#sqlmode_only_full_group_by
要获得您正在寻找的结果...
如果(master_id,type,date_sent)
元组在contact_copy
中是唯一的(也就是说,如果master_id
和type
的给定值,将不会有date_sent
的“重复”值),我们可以使用JOIN 操作来检索指定的结果。
首先,我们编写一个查询来获取给定master_id
和type
的“最大”date_sent
。例如:
SELECT mc.master_id
, mc.type
, MAX(mc.date_sent) AS max_date_sent
FROM contact_copy mc
WHERE mc.master_id = '0001'
AND mc.type = 'EMAIL'
要检索与“最大”date_sent
关联的整行,我们可以将该查询用作内联视图。也就是说,将查询文本包装在括号中,分配一个别名,然后将其作为一个表引用,例如:
SELECT c.master_id
, c.date_sent
, c.mailing
FROM ( SELECT mc.master_id
, mc.type
, MAX(mc.date_sent) AS max_date_sent
FROM contact_copy mc
WHERE mc.master_id = '0001'
AND mc.type = 'EMAIL'
) m
JOIN contact_copy c
ON c.master_id = m.master_id
AND c.type = m.type
AND c.date_sent = m.max_date_sent
请注意,如果有多个行具有相同的 master_id
、type
和 date_sent
值,则可能会返回不止一行。你可以添加一个LIMIT 1
子句来保证你只返回一行;返回的行中的哪一个是不确定的,在 LIMIT 子句之前没有 ORDER BY
子句。
【讨论】:
【参考方案2】:那是因为当你使用 GROUP BY 时,所有的列都必须是聚合列,而 mailing 不是其中之一..
您应该使用子查询或连接来使其工作
SELECT master_id,date_sent,mailing
FROM contact_copy cc
JOIN
( SELECT master_id,max(date_sent)
FROM contact_copy
WHERE type="EMAIL"
group BY master_id
) result
ON cc.master_id= result.master_id AND cc.date_sent=result.date_sent
【讨论】:
哈利路亚!!谢谢!以上是关于通过分组选择最大日期?的主要内容,如果未能解决你的问题,请参考以下文章
Mysql按日期时间的日期部分分组,并为每个日期选择具有最大日期时间的行
SQL - 使用分组方式选择,从具有最大值(日期)的寄存器中获取数据