如何使用聚合函数在 MySQL 查询中获取分组记录的第一条和最后一条记录?
Posted
技术标签:
【中文标题】如何使用聚合函数在 MySQL 查询中获取分组记录的第一条和最后一条记录?【英文标题】:How to fetch the first and last record of a grouped record in a MySQL query with aggregate functions? 【发布时间】:2010-11-25 15:49:49 【问题描述】:我正在尝试获取“分组”记录的第一条和最后一条记录。 更准确地说,我正在做这样的查询
SELECT MIN(low_price), MAX(high_price), open, close
FROM symbols
WHERE date BETWEEN(.. ..)
GROUP BY YEARWEEK(date)
但我想获得该组的第一条和最后一条记录。可以通过执行大量请求来完成,但我有一张很大的桌子。
是否有(如果可能的话,处理时间较短)使用 mysql 的方法?
【问题讨论】:
效率更高,见mysql.rjweb.org/doc.php/groupwise_max 【参考方案1】:你想使用GROUP_CONCAT
和SUBSTRING_INDEX
:
SUBSTRING_INDEX( GROUP_CONCAT(CAST(open AS CHAR) ORDER BY datetime), ',', 1 ) AS open
SUBSTRING_INDEX( GROUP_CONCAT(CAST(close AS CHAR) ORDER BY datetime DESC), ',', 1 ) AS close
这避免了昂贵的子查询,我发现它通常更有效地解决这个特定问题。
查看这两个函数的手册页以了解它们的参数,或访问本文,其中包含如何执行 timeframe conversion in MySQL 的示例以获取更多说明。
【讨论】:
感谢您的巧妙解决方案!尽管如此,我还是很遗憾 MySQL 不支持 FIRST() 和 LAST(),这会比这快得多... 优秀的解决方案。我想知道大型表的性能和内存注意事项,直到我看到操作限制在group_concat_max_len
定义的大小(默认为 1024)。美好时光!
所有子查询的性能不一样。很明显,不得不说很尴尬,但它在很大程度上依赖于子查询和它所嵌入的查询。以及不相关的子查询,(其中子查询的执行不依赖于每一行外部查询)并不比单独运行时更差(或更好)。因为下面我的解决方案中的子查询是...
我的问题的最佳解决方案,我看了很多!谢谢!避免讨厌的子查询或自联接。
你能写出完整的查询吗?谢谢【参考方案2】:
试试这个从...开始:
Select YearWeek, Date, Min(Low_Price), Max(High_Price)
From
(Select YEARWEEK(date) YearWeek, Date, LowPrice, High_Price
From Symbols S
Where Date BETWEEN(.. ..)
GROUP BY YEARWEEK(date)) Z
Group By YearWeek, Date
【讨论】:
【参考方案3】:这是针对这个特定问题的一个很好的特定解决方案: http://topwebguy.com/first-and-last-in-mysql-a-working-solution/ 这几乎就像在 MySQL 中使用 FIRST 和 LAST 一样简单。
我将包含实际提供解决方案的代码,但您可以查看全文:
SELECT
word ,
(SELECT a.ip_addr FROM article a
WHERE a.word = article.word
ORDER BY a.updated LIMIT 1) AS first_ip,
(SELECT a.ip_addr FROM article a
WHERE a.word = article.word
ORDER BY a.updated DESC LIMIT 1) AS last_ip
FROM notfound GROUP BY word;
【讨论】:
【参考方案4】:假设您想要具有最低 low_price 和最高 high_price 的记录的 ID,您可以将这两列添加到您的查询中,
SELECT
(SELECT id ORDER BY low_price ASC LIMIT 1) low_price_id,
(SELECT id ORDER BY high_price DESC LIMIT 1) high_price_id,
MIN(low_price), MAX(high_price), open, close
FROM symbols
WHERE date BETWEEN(.. ..)
GROUP BY YEARWEEK(date)
如果效率是一个问题,您应该为“year_week”添加一列,添加一些覆盖索引,并将查询一分为二。
'year_week' 列只是一个设置为 YEARWEEK(date) 值的 INT,并在更新 'date' 列时更新。这样您就不必为每个查询重新计算它,您可以对其进行索引。
新的覆盖索引应如下所示。顺序很重要。 KEY yw_lp_id (year_week, low_price, id), KEY yw_hp_id (year_week, high_price, id)
然后你应该使用这两个查询
SELECT
(SELECT id ORDER BY low_price ASC LIMIT 1) low_price_id,
MIN(low_price), open, close
FROM symbols
WHERE year_week BETWEEN(.. ..)
GROUP BY year_week
和
SELECT
(SELECT id ORDER BY high_price DESC LIMIT 1) high_price_id,
MAX(high_price), open, close
FROM symbols
WHERE year_week BETWEEN(.. ..)
GROUP BY year_week
覆盖索引非常有用。查看this了解更多详情。
【讨论】:
以上是关于如何使用聚合函数在 MySQL 查询中获取分组记录的第一条和最后一条记录?的主要内容,如果未能解决你的问题,请参考以下文章