使用 avg 和 group by 的 SQL 查询

Posted

技术标签:

【中文标题】使用 avg 和 group by 的 SQL 查询【英文标题】:SQL query with avg and group by 【发布时间】:2012-05-28 23:23:12 【问题描述】:

我在为 mysql 编写 SQL 查询时遇到了一些问题。我有一个具有以下结构的表:

mysql> select id, pass, val from data_r1 limit 10;
+------------+--------------+----------------+
| id         | pass         | val            |
+------------+--------------+----------------+
| DA02959106 | 5.0000000000 |  44.4007000000 |
| 08A5969201 | 1.0000000000 | 182.4100000000 |
| 08A5969201 | 2.0000000000 | 138.7880000000 |
| DA02882103 | 5.0000000000 |  44.7265000000 |
| DA02959106 | 1.0000000000 | 186.1470000000 |
| DA02959106 | 2.0000000000 | 148.2660000000 |
| DA02959106 | 3.0000000000 | 111.9050000000 |
| DA02959106 | 4.0000000000 |  76.1485000000 |
| DA02959106 | 5.0000000000 |  44.4007000000 |
| DA02959106 | 4.0000000000 |  76.6485000000 |

我想创建一个从表中提取以下信息的查询:

id, AVG of 'val' for 'pass' = 1, AVG of 'val' for 'pass' = 2, etc

查询的结果应该是这样的:

+------------+---------+---------+---------+---------+---------+---------+---------+
| id         | val_1   | val_2   | val_3   | val_4   | val_5   | val_6   | val_7   |
+------------+---------+---------+---------+---------+---------+---------+---------+
| DA02959106 | 186.147 | 148.266 | 111.905 | 76.3985 | 44.4007 | 0       | 0       |
+------------+---------+---------+---------+---------+---------+---------+---------+

当然,每个唯一的“id”都有更多的行。

我已经尝试了一些类似的查询

SELECT id, pass, AVG(val) AS val_1 FROM data_r1 WHERE pass = 1 GROUP BY id;

这会返回正确的结果,但我必须使用“pass”的其他可能值(最多 7 个)的结果来扩展它

我尝试在 AVG 中使用嵌套的 SELECT,但这不起作用,因为我不知道如何正确地将其限制为当前的 'id'。

然后,我创建了视图来表示“pass”=1、“pass”=2 等的每个查询的结果。但对于大多数 id,“pass”的最大值是 5。当使用 JOIN 查询获取视图的最终结果我收到了一个空的结果集,因为一些视图是空的/没有特定“id”的值。

有什么想法吗?

【问题讨论】:

您有 3 记录与 pass = 5,所有具有不同的 id。你想要哪个id?请发布您所提供数据的预期输出。 您的 AVG 值是否必须在列中,或者您所需的查询是否可以返回与存在的不同传递值一样多的行? 我编辑了我的问题并添加了一个我期望结果的表格。我必须将结果提供给另一个程序,所以每行应该有一个 id。 我编辑的查询提供了您所要求的准确结果... 【参考方案1】:

如果我明白你的需要,试试这个:

SELECT id, pass, AVG(val) AS val_1 
FROM data_r1 
GROUP BY id, pass;

或者,如果您只希望每个 id 有一行,则:

SELECT d1.id,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 1) as val_1,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 2) as val_2,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 3) as val_3,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 4) as val_4,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 5) as val_5,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 6) as val_6,
    (SELECT IFNULL(ROUND(AVG(d2.val), 4) ,0) FROM data_r1 d2 
     WHERE d2.id = d1.id AND pass = 7) as val_7
from data_r1 d1
GROUP BY d1.id

【讨论】:

Marco,我刚刚尝试了您的解决方案,它似乎完全符合我的要求。不知道您可以从“内部”SELECT 引用到外部。非常感谢!【参考方案2】:

据我了解,您需要每次通过时每个 id 的平均值。解决办法是

SELECT id, pass, avg(value) FROM data_r1
GROUP BY id, pass;

【讨论】:

以上是关于使用 avg 和 group by 的 SQL 查询的主要内容,如果未能解决你的问题,请参考以下文章

SQL中group by语句有何作用?

AVG有LIMIT和GROUP BY

SQL中只要用到聚合函数就一定要用到group by 吗?

sqlserver group by 非聚集多字段组合索引性能慢的问题

SQL中GROUP BY用法示例

sqlserver2008,sql编程,group by 用法