MySQL 查询 GROUP BY 日/月/年
Posted
技术标签:
【中文标题】MySQL 查询 GROUP BY 日/月/年【英文标题】:MySQL Query GROUP BY day / month / year 【发布时间】:2010-10-05 06:14:02 【问题描述】:是否可以进行一个简单的查询来计算我在确定的时间段内(例如一年、一个月或一天)有多少条记录,具有TIMESTAMP
字段,例如:
SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR
甚至:
SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH
每月统计。
谢谢!
【问题讨论】:
我猜你的第一个代码 sn-p 中应该是GROUP BY record_date.MONTH
?
【参考方案1】:
我想每天得到类似的数据,经过一番试验,这是我能找到的最快的场景
SELECT COUNT(id)
FROM stats
GROUP BY record_date DIV 1000000;
如果您想每月获得一次,请添加额外的零 (00) 我不会从“使代码可读”的角度推荐这个,它也可能在不同的版本中中断。但在我们的例子中,与我测试的其他一些更清晰的查询相比,这花费的时间不到一半。
这是一个 mysql 答案(因为 MySQL 在问题中被标记)并且在手册 https://dev.mysql.com/doc/refman/8.0/en/date-and-time-type-conversion.html 中有详细记录
【讨论】:
为什么会这样? MySQL的一个怪癖。在完成此查询时,它会将2021-03-04 05:06:07
隐式转换为数字 20,210,304,050,607。 (为清楚起见,添加了逗号)。该数字的DIV 1,000,000
产生数字 20,210,304,代表这一天。在处理其他人的数据时,最好避免这种特殊的怪癖。
在 MySQL 中将日期转换为数字已记录在案 dev.mysql.com/doc/refman/8.0/en/…“将 TIME 和 DATETIME 值转换为数字形式(例如,通过添加 +0)”所以这不是一个怪癖,但它确实使查询不太清楚。
这是一个怪癖,因为其他 dbms 制造和模型不以这种方式工作。
更新了答案,明确说明这是 MySQL 的一个功能,有据可查,不应期望它与其他任何东西一起使用。该问题的标题中有 MySQL,并且也带有 mysql 标记,因此在该上下文中找到并回答了它。【参考方案2】:
这里还有另一种方法。这使用 [MySQL 的 LAST_DAY() 函数][1] 将每个时间戳映射到其月份。如果record_date
上有索引,它还能够通过有效的范围扫描按年份过滤。
SELECT LAST_DAY(record_date) month_ending, COUNT(*) record_count
FROM stats
WHERE record_date >= '2000-01-01'
AND record_date < '2000-01-01' + INTERVAL 1 YEAR
GROUP BY LAST_DAY(record_date)
如果您想要每天的结果,请改用DATE(record_date)
。
如果您希望按日历季度获得结果,请使用YEAR(record_date), QUARTER(record_date)
。
这是一篇文章。 https://www.plumislandmedia.net/mysql/sql-reporting-time-intervals/ [1]:https://dev.mysql.com/doc/refman/8.0/en/date-and-time-functions.html#function_last-day
【讨论】:
【参考方案3】:您可以在 GROUP BY 中简单地使用 Mysql DATE_FORMAT() 函数。在某些情况下,您可能需要添加一个额外的列以增加清晰度,例如记录跨越几年,然后同一个月出现在不同的年份。这里有很多选项可以自定义。请在开始之前阅读此内容。希望它对你很有帮助。这是示例查询以供您理解
SELECT
COUNT(id),
DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
DATE_FORMAT(record_date, '%Y') AS YEAR
FROM
stats
WHERE
YEAR = 2009
GROUP BY
DATE_FORMAT(record_date, '%Y-%m-%d ');
【讨论】:
【参考方案4】:完整而简单的解决方案,具有类似性能但更短且更灵活的替代方案,目前处于活动状态:
SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')
【讨论】:
【参考方案5】:如果您的搜索时间超过几年,并且您仍想按月分组,我建议:
版本 #1:
SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')
版本 #2(更高效):
SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)
我在一张有 1,357,918 行 (innodb) 的大桌子上比较了这些版本, 并且第二个版本似乎有更好的结果。
version1 (平均执行 10 次):1.404 秒 version2 (平均执行 10 次):0.780 秒
(添加了SQL_NO_CACHE
键以防止 MySQL 对查询进行缓存。)
【讨论】:
考虑将@fu-chi 的建议包含在您的测试中,它可能会更有效。另外,您测试了GROUP BY YEAR(record_date)*100 + MONTH(record_date)
,但为什么不测试GROUP BY YEAR(record_date), MONTH(record_date)
?
如果你使用 COUNT(1) 而不是 COUNT(*) 会更快,而且结果数据是一样的。
版本 #2 上的 *100
是什么?提前致谢。
*100
到 YEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')
【参考方案6】:
.... group by to_char(date, 'YYYY')
--> 1989
.... group by to_char(date,'MM')
-->05
.... group by to_char(date,'DD')
--->23
.... group by to_char(date,'MON')
--->可能
.... group by to_char(date,'YY')
--->89
【讨论】:
这会非常非常慢。【参考方案7】:我更喜欢像这样优化一年组选择:
SELECT COUNT(*)
FROM stats
WHERE record_date >= :year
AND record_date < :year + INTERVAL 1 YEAR;
这样你就可以一次绑定年份,例如'2009'
,带命名参数,不用担心单独添加'-01-01'
或传入'2010'
。
另外,大概我们只是在计算行数,而id
永远不是NULL
,我更喜欢COUNT(*)
而不是COUNT(id)
。
【讨论】:
【参考方案8】:以下查询在 Oracle Database 12c 版本 12.1.0.1.0 中对我有用
SELECT COUNT(*)
FROM stats
GROUP BY
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR FROM TIMESTAMP);
【讨论】:
【参考方案9】:如果您想过滤特定年份(例如 2000 年)的记录,请优化 WHERE
子句,如下所示:
SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.
代替:
WHERE YEAR(date_column) = 2000
-- average 0.132 sec.
结果是针对包含 300k 行和日期列索引的表生成的。
至于GROUP BY
子句,我对照上表测试了三个变体;结果如下:
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.
SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.
最后一个是获胜者。
【讨论】:
【参考方案10】:如果您想获得按最近月份排序的每年每月行数的月度统计数据,请尝试以下操作:
SELECT count(id),
YEAR(record_date),
MONTH(record_date)
FROM `table`
GROUP BY YEAR(record_date),
MONTH(record_date)
ORDER BY YEAR(record_date) DESC,
MONTH(record_date) DESC
【讨论】:
【参考方案11】:我尝试使用上面的“WHERE”语句,我认为它是正确的,因为没有人纠正它,但我错了;经过一番搜索,我发现这是 WHERE 语句的正确公式,所以代码变成了这样:
SELECT COUNT(id)
FROM stats
WHERE YEAR(record_date) = 2009
GROUP BY MONTH(record_date)
【讨论】:
【参考方案12】:GROUP BY @987654321@(record_date, '%Y%m')
注意(主要是给潜在的反对者)。目前,这可能不如其他建议有效。尽管如此,我还是把它作为一种替代方案,也可以作为一种替代方案,它可以帮助我们了解其他解决方案的速度有多快。 (因为在你看到区别之前,你无法真正区分快与慢。)此外,随着时间的推移,可以对 MySQL 的引擎进行关于优化的更改,以便在某些情况下(也许不是这样)做出这个解决方案遥远的)未来点,在效率上与大多数其他人相当。
【讨论】:
我感觉这不会很好,因为格式函数无法在日期列上使用索引。 @Stv:那么您可能需要考虑@fu-chi's answer。据我所知,该答案和我的答案中的分组表达式计算结果相同,但EXTRACT()
可能比DATE_FORMAT()
更有效。 (不过,我没有用于正确测试的 MySQL。)
我喜欢按日期和时间函数年、月等进行分组。但我喜欢在选择中使用 date_format 来重构组的日期date_format(concat(year(timestamp), "-", month(timestamp), "-", day(timestamp), " ", hour(timestamp), ":00"), '%Y-%m-%d')
【参考方案13】:
试试这个
SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)
EXTRACT(unit FROM date) 函数更好,因为使用较少的分组并且函数返回一个数字值。
分组时的比较条件将比 DATE_FORMAT 函数(返回字符串值)更快。尝试使用为 SQL 比较条件(WHERE、HAVING、ORDER BY、GROUP BY)返回非字符串值的函数|字段。
【讨论】:
【参考方案14】:如果您想在 MySQL 中按日期分组,请使用以下代码:
SELECT COUNT(id)
FROM stats
GROUP BY DAYOFMONTH(record_date)
希望这可以为那些将要找到此线程的人节省一些时间。
【讨论】:
请务必注意,您还需要按MONTH(record_date)
分组,以计入多个月。【参考方案15】:
GROUP BY YEAR(record_date), MONTH(record_date)
查看 MySQL 中的 date and time functions。
【讨论】:
在某些情况下,例如记录跨越数年的情况,您可能需要添加一个额外的列以增加清晰度。 SELECT COUNT(event_id), DATE_FORMAT(event_start, '%Y/%m') 简单完整示例:SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date);
注意:record_date 是日期类型 TIMESTAMP
可能值得一提的是,这并没有在我的 MySQL 5.7 上运行,带有 COUNT 别名列(没有错误,我得到零结果)。当我更改为使用别名选择那些字段时,我可以按别名进行分组。这是在本地环境中运行的标准 MySQL 5.7 docker 映像,所以我不知道为什么它没有错误或返回结果。
天哪,如果我早点知道的话……这么多行 php 来做一些 mysql 可以在一行中做的事情。以上是关于MySQL 查询 GROUP BY 日/月/年的主要内容,如果未能解决你的问题,请参考以下文章