MySQL 查询 GROUP BY 日/月/年

Posted

技术标签:

【中文标题】MySQL 查询 GROUP BY 日/月/年【英文标题】:MySQL Query GROUP BY day / month / year 【发布时间】:2010-10-05 06:14:02 【问题描述】:

是否可以进行一个简单的查询来计算我在确定的时间段内(例如一年、一个月或一天)有多少条记录,具有TIMESTAMP 字段,例如:

SELECT COUNT(id)
FROM stats
WHERE record_date.YEAR = 2009
GROUP BY record_date.YEAR

甚至:

SELECT COUNT(id)
FROM stats
GROUP BY record_date.YEAR, record_date.MONTH

每月统计。

谢谢!

【问题讨论】:

我猜你的第一个代码 sn-p 中应该是GROUP BY record_date.MONTH 【参考方案1】:

我想每天得到类似的数据,经过一番试验,这是我能找到的最快的场景

SELECT COUNT(id)
FROM stats
GROUP BY record_date DIV 1000000;

如果您想每月获得一次,请添加额外的零 (00) 我不会从“使代码可读”的角度推荐这个,它也可能在不同的版本中中断。但在我们的例子中,与我测试的其他一些更清晰的查询相比,这花费的时间不到一半。

这是一个 mysql 答案(因为 MySQL 在问题中被标记)并且在手册 https://dev.mysql.com/doc/refman/8.0/en/date-and-time-type-conversion.html 中有详细记录

【讨论】:

为什么会这样? MySQL的一个怪癖。在完成此查询时,它会将2021-03-04 05:06:07 隐式转换为数字 20,210,304,050,607。 (为清楚起见,添加了逗号)。该数字的DIV 1,000,000 产生数字 20,210,304,代表这一天。在处理其他人的数据时,最好避免这种特殊的怪癖。 在 MySQL 中将日期转换为数字已记录在案 dev.mysql.com/doc/refman/8.0/en/…“将 TIME 和 DATETIME 值转换为数字形式(例如,通过添加 +0)”所以这不是一个怪癖,但它确实使查询不太清楚。 这是一个怪癖,因为其他 dbms 制造和模型不以这种方式工作。 更新了答案,明确说明这是 MySQL 的一个功能,有据可查,不应期望它与其他任何东西一起使用。该问题的标题中有 MySQL,并且也带有 mysql 标记,因此在该上下文中找到并回答了它。【参考方案2】:

这里还有另一种方法。这使用 [MySQL 的 LAST_DAY() 函数][1] 将每个时间戳映射到其月份。如果record_date 上有索引,它还能够通过有效的范围扫描按年份过滤。

  SELECT LAST_DAY(record_date) month_ending, COUNT(*) record_count
    FROM stats
   WHERE record_date >= '2000-01-01'
     AND record_date <  '2000-01-01' + INTERVAL 1 YEAR
   GROUP BY LAST_DAY(record_date) 

如果您想要每天的结果,请改用DATE(record_date)

如果您希望按日历季度获得结果,请使用YEAR(record_date), QUARTER(record_date)

这是一篇文章。 https://www.plumislandmedia.net/mysql/sql-reporting-time-intervals/ [1]:https://dev.mysql.com/doc/refman/8.0/en/date-and-time-functions.html#function_last-day

【讨论】:

【参考方案3】:

您可以在 GROUP BY 中简单地使用 Mysql DATE_FORMAT() 函数。在某些情况下,您可能需要添加一个额外的列以增加清晰度,例如记录跨越几年,然后同一个月出现在不同的年份。这里有很多选项可以自定义。请在开始之前阅读此内容。希望它对你很有帮助。这是示例查询以供您理解

SELECT
    COUNT(id),
    DATE_FORMAT(record_date, '%Y-%m-%d') AS DAY,
    DATE_FORMAT(record_date, '%Y-%m') AS MONTH,
    DATE_FORMAT(record_date, '%Y') AS YEAR

FROM
    stats
WHERE
    YEAR = 2009
GROUP BY
    DATE_FORMAT(record_date, '%Y-%m-%d ');

【讨论】:

【参考方案4】:

完整而简单的解决方案,具有类似性能但更短且更灵活的替代方案,目前处于活动状态:

SELECT COUNT(*) FROM stats
-- GROUP BY YEAR(record_date), MONTH(record_date), DAYOFMONTH(record_date)
GROUP BY DATE_FORMAT(record_date, '%Y-%m-%d')

【讨论】:

【参考方案5】:

如果您的搜索时间超过几年,并且您仍想按月分组,我建议:

版本 #1:

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY DATE_FORMAT(record_date, '%Y%m')

版本 #2(更高效)

SELECT SQL_NO_CACHE YEAR(record_date), MONTH(record_date), COUNT(*)
FROM stats
GROUP BY YEAR(record_date)*100 + MONTH(record_date)

我在一张有 1,357,918 行 (innodb) 的大桌子上比较了这些版本, 并且第二个版本似乎有更好的结果。

version1 (平均执行 10 次):1.404 秒 version2 (平均执行 10 次):0.780 秒

(添加了SQL_NO_CACHE 键以防止 MySQL 对查询进行缓存。)

【讨论】:

考虑将@fu-chi 的建议包含在您的测试中,它可能会更有效。另外,您测试了GROUP BY YEAR(record_date)*100 + MONTH(record_date),但为什么不测试GROUP BY YEAR(record_date), MONTH(record_date) 如果你使用 COUNT(1) 而不是 COUNT(*) 会更快,而且结果数据是一样的。 版本 #2 上的 *100 是什么?提前致谢。 *100YEAR(record_date)*100 + MONTH(record_date) == DATE_FORMAT(record_date, '%Y%m')【参考方案6】:

.... group by to_char(date, 'YYYY') --> 1989

.... group by to_char(date,'MM') -->05

.... group by to_char(date,'DD') --->23

.... group by to_char(date,'MON') --->可能

.... group by to_char(date,'YY') --->89

【讨论】:

这会非常非常慢。【参考方案7】:

我更喜欢像这样优化一年组选择:

SELECT COUNT(*)
  FROM stats
 WHERE record_date >= :year 
   AND record_date <  :year + INTERVAL 1 YEAR;

这样你就可以一次绑定年份,例如'2009',带命名参数,不用担心单独添加'-01-01'或传入'2010'

另外,大概我们只是在计算行数,而id 永远不是NULL,我更喜欢COUNT(*) 而不是COUNT(id)

【讨论】:

【参考方案8】:

以下查询在 Oracle Database 12c 版本 12.1.0.1.0 中对我有用

SELECT COUNT(*)
FROM stats
GROUP BY 
extract(MONTH FROM TIMESTAMP),
extract(MONTH FROM TIMESTAMP),
extract(YEAR  FROM TIMESTAMP);

【讨论】:

【参考方案9】:

如果您想过滤特定年份(例如 2000 年)的记录,请优化 WHERE 子句,如下所示:

SELECT MONTH(date_column), COUNT(*)
FROM date_table
WHERE date_column >= '2000-01-01' AND date_column < '2001-01-01'
GROUP BY MONTH(date_column)
-- average 0.016 sec.

代替:

WHERE YEAR(date_column) = 2000
-- average 0.132 sec.

结果是针对包含 300k 行和日期列索引的表生成的。

至于GROUP BY 子句,我对照上表测试了三个变体;结果如下:

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY YEAR(date_column), MONTH(date_column)
-- codelogic
-- average 0.250 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY DATE_FORMAT(date_column, '%Y%m')
-- Andriy M
-- average 0.468 sec.

SELECT YEAR(date_column), MONTH(date_column), COUNT(*)
FROM date_table
GROUP BY EXTRACT(YEAR_MONTH FROM date_column)
-- fu-chi
-- average 0.203 sec.

最后一个是获胜者。

【讨论】:

【参考方案10】:

如果您想获得按最近月份排序的每年每月行数的月度统计数据,请尝试以下操作:

SELECT count(id),
      YEAR(record_date),
      MONTH(record_date) 
FROM `table` 
GROUP BY YEAR(record_date),
        MONTH(record_date) 
ORDER BY YEAR(record_date) DESC,
        MONTH(record_date) DESC

【讨论】:

【参考方案11】:

我尝试使用上面的“WHERE”语句,我认为它是正确的,因为没有人纠正它,但我错了;经过一番搜索,我发现这是 WHERE 语句的正确公式,所以代码变成了这样:

SELECT COUNT(id)  
FROM stats  
WHERE YEAR(record_date) = 2009  
GROUP BY MONTH(record_date)

【讨论】:

【参考方案12】:
GROUP BY @987654321@(record_date, '%Y%m')

注意(主要是给潜在的反对者)。目前,这可能不如其他建议有效。尽管如此,我还是把它作为一种替代方案,也可以作为一种替代方案,它可以帮助我们了解其他解决方案的速度有多快。 (因为在你看到区别之前,你无法真正区分快与慢。)此外,随着时间的推移,可以对 MySQL 的引擎进行关于优化的更改,以便在某些情况下(也许不是这样)做出这个解决方案遥远的)未来点,在效率上与大多数其他人相当。

【讨论】:

我感觉这不会很好,因为格式函数无法在日期列上使用索引。 @Stv:那么您可能需要考虑@fu-chi's answer。据我所知,该答案和我的答案中的分组表达式计算结果相同,但EXTRACT() 可能比DATE_FORMAT() 更有效。 (不过,我没有用于正确测试的 MySQL。) 我喜欢按日期和时间函数年、月等进行分组。但我喜欢在选择中使用 date_format 来重构组的日期date_format(concat(year(timestamp), "-", month(timestamp), "-", day(timestamp), " ", hour(timestamp), ":00"), '%Y-%m-%d')【参考方案13】:

试试这个

SELECT COUNT(id)
FROM stats
GROUP BY EXTRACT(YEAR_MONTH FROM record_date)

EXTRACT(unit FROM date) 函数更好,因为使用较少的分组并且函数返回一个数字值。

分组时的比较条件将比 DATE_FORMAT 函数(返回字符串值)更快。尝试使用为 SQL 比较条件(WHERE、HAVING、ORDER BY、GROUP BY)返回非字符串值的函数|字段。

【讨论】:

【参考方案14】:

如果您想在 MySQL 中按日期分组,请使用以下代码:

 SELECT COUNT(id)
 FROM stats
 GROUP BY DAYOFMONTH(record_date)

希望这可以为那些将要找到此线程的人节省一些时间。

【讨论】:

请务必注意,您还需要按MONTH(record_date) 分组,以计入多个月。【参考方案15】:
GROUP BY YEAR(record_date), MONTH(record_date)

查看 MySQL 中的 date and time functions。

【讨论】:

在某些情况下,例如记录跨越数年的情况,您可能需要添加一个额外的列以增加清晰度。 SELECT COUNT(event_id), DATE_FORMAT(event_start, '%Y/%m') 简单完整示例:SELECT count(*), record_date FROM anytable WHERE anytable.anycolumn = 'anycondition' GROUP BY YEAR(record_date), month(record_date); 注意:record_date 是日期类型 TIMESTAMP 可能值得一提的是,这并没有在我的 MySQL 5.7 上运行,带有 COUNT 别名列(没有错误,我得到零结果)。当我更改为使用别名选择那些字段时,我可以按别名进行分组。这是在本地环境中运行的标准 MySQL 5.7 docker 映像,所以我不知道为什么它没有错误或返回结果。 天哪,如果我早点知道的话……这么多行 php 来做一些 mysql 可以在一行中做的事情。

以上是关于MySQL 查询 GROUP BY 日/月/年的主要内容,如果未能解决你的问题,请参考以下文章

我们可以使用group by和where字段名相同的条件

MySQL查询日期在结果中加入汉字“年”“月”“日”

MySQL查询日期在结果中加入汉字“年”“月”“日”

mysql按时间查询(年/月/日)

如何在选择查询(MySQL)中仅消除连续重复而不是所有重复?

[Mysql 查询语句]——分组查询group by