在SQL中分组查询 Group by 的存在条件是啥
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在SQL中分组查询 Group by 的存在条件是啥相关的知识,希望对你有一定的参考价值。
在select 语句中 Group by的存在条件是什么 为什么数据库总是报这样的错误:消息 8120,级别 16,状态 1,第 1 行选择列表中的列 'userinfo.UserName' 无效,因为该列没有包含在聚合函数或 GROUP BY 子句中。 请说的详细点,最好举个例子..谢谢
Group By子句Group By子句可以将表的行划分为不同的组。分别总结每个组,这样就可以控制想要看见的详细信息的级别。
语法:
[ Group By [ ALL ] Group_By_expression[ ,...n ]
[ WITH ] ]
参数说明:
ALL:包含所有组和结果集,甚至包含那些任何行都不满足WHERE子句指定的搜索条件的组和结果集。如果指定了ALL,将对组中不满足搜索条件的汇总列返回空值。不能用CUBE或ROLLUP运算符指定ALL。如果访问远程表的查询中有WHERE子句,则不支持Group By ALL操作。
Group_By_expression:对其执行分组的表达式。Group_By_expression也称为分组列。Group_By_expression可以是列或引用列的非聚合表达式。在选择列表内定义的列的别名不能用于指定分组列。对于不包含CUBE或ROLLUP的Group By子句,Group_By_ expression的项数受查询所涉及的Group By列的大小、聚合列和聚合值的限制。该限制从8060字节的限制开始,对保存中间查询结果所需的中间级工作表有8060字节的限制。如果指定了CUBE或ROLLUP,则最多只能有10个分组表达式。
CUBE:指定在结果集内不仅包含由Group By提供的正常行,还包含汇总行。在结果集内返回每个可能的组和子组组合的Group By汇总行。Group By汇总行在结果中显示为NULL,但可用来表示所有值。使用GroupING函数确定结果集内的空值是否是Group By汇总值。结果集内的汇总行数取决于Group By子句内包含的列数。Group By子句中的每个操作数(列)绑定在分组NULL下,并且分组适用于所有其他操作数(列)。由于CUBE返回每个可能的组和子组组合,因此,不论指定分组列所使用的是什么顺序,行数都相同。
ROLLUP:指定在结果集内不仅包含由Group By提供的正常行,还包含汇总行。按层次结构顺序,从组内的最低级别到最高级别汇总组。组的层次结构取决于指定分组列时所使用的顺序。更改分组列的顺序会影响在结果集内生成的行数。
使用Group By子句的注意事项。
(1)在SELECT子句的字段列表中,除了聚集函数外,其他所出现的字段一定要在Group By子句中有定义才行。例如“Group By A,B”,那么“SELECT SUM(A),C”就有问题,因为C不在Group By中,但是SUM(A)是可以的。
(2)SELECT子句的字段列表中不一定要有聚集函数,但至少要用到Group By子句列表中的一个项目。例如“Group By A,B,C”,则“SELECT A”是可以的。
(3)在SQL Server中text、ntext和image数据类型的字段不能作为Group By子句的分组依据。
(4)Group By子句不能使用字段别名。
1.按单列进行分组
Group By子句可以基于指定某一列的值将数据集合划分为多个分组,同一组内所有记录在分组属性上具有相同值。
示例:
把“student”表按照“性别”这个单列进行分组。在查询分析器中输入的SQL语句如下:
use student
select 性别
from student
Group By 性别
但仍然要强调SELECT子句必须与Group By后的子句或者是分组函数列相一致。
例如,由于下列查询中“姓名”列既不包含在Group By子句中,也不包含在分组函数中,所以是错误的。错误的SQL语句如下:
use student select 姓名,性别 from student Group By 性别
例如,在“grade”表中,按“学期”分组查询。SQL语句如下:
use studnet select 学期 from grade Group By 学期
2.按多列进行分组
Group By子句可以基于指定多列的值将数据集合划分为多个分组。
示例:
在“student”表中,按照“性别”和“年龄”列进行分组。在查询分析中输入的SQL语句如下:
use student
select 性别,年龄
from student
Group By 性别,年龄
在“student”表中,首先按照“性别”分组,然后再按照“年龄”分组。
再举一个例子,例如,在“grade”表中,按照“学号”和“课程代号”列进行分组。SQL语句如下:
use student
select 学号,课程代号 from grade Group By 学号,课程代号
按多列进行分组时有NULL组的是如何处理的。当表按多列进行分组时有NULL组,这时NULL被作为一个特定值处理,就像其他任何值一样。也就是说,如果在某个分组列中存在两个NULL,则按它们有相同的值那样处理,并将它们放在相同的组中。
示例:
在“grade”表中,按“学期”和“课程代号”列进行分组。在查询分析器中输入的SQL语句如下:
use student
select 学期,课程代号
from grade
Group By 学期,课程代号
3.与聚集函数一起使用
Group By子句是经常与聚集函数一起使用。如果SELECT子句中包含聚集函数,则计算每组的汇总值,当用户指定Group By时,选择列表中任一非聚集表达式内的所有列都应包含在Group By列表中,或者Group By表达式必须与选择列表表达式完全匹配。
示例:
在“student”表中,分别求男女生的平均年龄。在查询分析器中输入的SQL语句如下:
use student
select 性别,avg(年龄) as 平均年龄
from student
Group By 性别
例如,在“student”表中,分别求有多少个男生和女生。SQL语句如下:
use student
select 性别,count(性别) as 人数 from student Group By 性别
说明:关于聚合函数的详细讲解可参阅9.2.1节。
4.与HAVING子句一起使用
HAVING子句对Group By子句选择出来的结果进行再次筛选,最后输出符合HAVING子句中条件的记录。HAVING子句的语法与WHERE子句的语法相类似,惟一不同的是HAVING子句中可以包含聚合函数。
语法:
[HAVING <search_condition>]
参数说明:
<search_condition>:指定组或聚合应满足的搜索条件。当HAVING与Group By ALL一起使用时,HAVING 子句替代ALL。
示例:
在“student”表中,按“性别”分组求平均年龄,并且查询其平均年龄大于21的学生信息。在查询分析器中输入的SQL语句如下:
use student
select avg(年龄), 性别
from student
Group By 性别
having avg(年龄)>21
在“grade”表中,按“学期”分组求平均成绩,并且查询“平均成绩”大于93的课程信息。在查询分析器中输入的SQL语句如下:
use student
select 学期,avg(课程成绩) as 平均成绩
from grade
Group By 学期
having avg(课程成绩)>93
说明:HAVING查询条件是在进行分组操作之后才应用的;在HAVING子句中不能使用text、image和ntext 数据类型。
5.对统计结果进行排序
统计结果并不能保证结果集内记录按一定顺序排列,如果使用ORDER By子句,就可以使结果集中的结果按一定的顺序(升序、降序)排序。
示例:
在“student”表中,按“性别”和“年龄”列分组,并按“年龄”列降序排序。在查询分析器中输入的SQL语句如下:
use student
select 性别,年龄
from student
Group By 性别,年龄
order By 年龄 desc
例如,在“grade”表中,按“学号”分组,并按课程的“平均成绩”升序排序。SQL语句如下:
use student
select 学号,avg(课程成绩) as 平均成绩 from grade Group By 学号 order By 平均成绩
参考技术A 分组查询中:select后的字段必须是group by中包含的字段如下:
select userinfo.班级,count(userinfo.sex) from userinfo group by 班级,userinfo.sex;
语句的含义为:按照班级分组,统计每个班级的男、女总数本回答被提问者采纳 参考技术B 用group by时,当前查询语句中的select,只能包含分类的项和其他分类进行的聚合操作。
如果一个表里有,id,classid,money
数据有 1,101,34
2,101,23
1,102,39
应该用select classid ,sum(money) from table1 group by classid这样的。。如果在select 中加入id,那么一个101的classid对应2条数据,而求和后101应该只有一条数据,这本身就是个矛盾。 参考技术C 抱你sql语句贴出来看看分析下ok
SQL group by分组查询
本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析。创建分组是通过GROUP BY子句实现的。与WHERE子句不同,GROUP BY子句用于归纳信息类型,以汇总相关数据。GROUP BY的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理。
在SQL Server中使用的分组查询是ORDER BY子句,使用ORDER BY子句要同聚合函数配合使用才能完成分组查询,在SELECT查询的字段中如果字段没有使用聚合函数就必须出现在ORDER BY子句中(即SELECT后边的字段名要么出现在聚合函数中,要么在ORDER BY子句中使用)
在分组查询中还可以配合使用HAVING子句,定义查询条件。
使用group by进行分组查询
在使用group by关键字时,在select列表中可以指定的项目是有限制的,select语句中仅许以下几项:
〉被分组的列
〉为每个分组返回一个值得表达式,例如用一个列名作为参数的聚合函数
group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面(重要)
group by实例
实例一
数据表:
姓名 科目 分数
张三 语文 80
张三 数学 98
张三 英语 65
李四 语文 70
李四 数学 80
李四 英语 90
期望查询结果:
姓名 语文 数学 英语
张三 80 98 65
李四 70 80 90
代码
SQL 代码 复制
create table testScore
(
tid int primary key identity(1,1),
tname varchar(30) null,
ttype varchar(10) null,
tscor int null
)
go
---插入数据
insert into testScore values (‘张三‘,‘语文‘,80)
insert into testScore values (‘张三‘,‘数学‘,98)
insert into testScore values (‘张三‘,‘英语‘,65)
insert into testScore values (‘李四‘,‘语文‘,70)
insert into testScore values (‘李四‘,‘数学‘,80)
insert into testScore values (‘李四‘,‘英语‘,90)
select tname as ‘姓名‘ ,
max(case ttype when ‘语文‘ then tscor else 0 end) ‘语文‘,
max(case ttype when ‘数学‘ then tscor else 0 end) ‘数学‘,
max(case ttype when ‘英语‘ then tscor else 0 end) ‘英语‘
from testScore
group by tname
实例二
有如下数据:(为了看得更清楚,我并没有使用国家代码,而是直接用国家名作为Primary Key)
国家(country) |
人口(population) |
中国 |
600 |
美国 |
100 |
加拿大 |
100 |
英国 |
200 |
法国 |
300 |
日本 |
250 |
德国 |
200 |
墨西哥 |
50 |
印度 |
250 |
根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。
洲 |
人口 |
亚洲 |
1100 |
北美洲 |
250 |
其他 |
700 |
代码
SQL 代码 复制
SELECT SUM(population),
CASE country
WHEN ‘中国‘ THEN ‘亚洲‘
WHEN ‘印度‘ THEN ‘亚洲‘
WHEN ‘日本‘ THEN ‘亚洲‘
WHEN ‘美国‘ THEN ‘北美洲‘
WHEN ‘加拿大‘ THEN ‘北美洲‘
WHEN ‘墨西哥‘ THEN ‘北美洲‘
ELSE ‘其他‘ END
FROM Table_A
GROUP BY CASE country
WHEN ‘中国‘ THEN ‘亚洲‘
WHEN ‘印度‘ THEN ‘亚洲‘
WHEN ‘日本‘ THEN ‘亚洲‘
WHEN ‘美国‘ THEN ‘北美洲‘
WHEN ‘加拿大‘ THEN ‘北美洲‘
WHEN ‘墨西哥‘ THEN ‘北美洲‘
ELSE ‘其他‘ END;
同样的,我们也可以用这个方法来判断工资的等级,并统计每一等级的人数。SQL代码如下;
SQL 代码 复制
SELECT
CASE WHEN salary <= 500 THEN ‘1‘
WHEN salary > 500 AND salary <= 600 THEN ‘2‘
WHEN salary > 600 AND salary <= 800 THEN ‘3‘
WHEN salary > 800 AND salary <= 1000 THEN ‘4‘
ELSE NULL END salary_class,
COUNT(*)
FROM Table_A
GROUP BY
CASE WHEN salary <= 500 THEN ‘1‘
WHEN salary > 500 AND salary <= 600 THEN ‘2‘
WHEN salary > 600 AND salary <= 800 THEN ‘3‘
WHEN salary > 800 AND salary <= 1000 THEN ‘4‘
ELSE NULL END;
对于groupby后面一般都是跟一个列名,但在该例子中通过case语句使分组变得跟强大了。
实例三
有如下数据
国家(country) |
性别(sex) |
人口(population) |
中国 |
1 |
340 |
中国 |
2 |
260 |
美国 |
1 |
45 |
美国 |
2 |
55 |
加拿大 |
1 |
51 |
加拿大 |
2 |
49 |
英国 |
1 |
40 |
英国 |
2 |
60 |
按照国家和性别进行分组,得出结果如下
国家 |
男 |
女 |
中国 |
340 |
260 |
美国 |
45 |
55 |
加拿大 |
51 |
49 |
英国 |
40 |
60 |
代码
SQL 代码 复制
SELECT country,
SUM( CASE WHEN sex = ‘1‘ THEN
population ELSE 0 END), --男性人口
SUM( CASE WHEN sex = ‘2‘ THEN
population ELSE 0 END) --女性人口
FROM Table_A
GROUP BY country;
GROUP BY子句中的NULL值处理
当GROUP BY子句中用于分组的列中出现NULL值时,将如何分组呢?SQL中,NULL不等于NULL(在WHERE子句中有过介绍)。然而,在GROUP BY子句中,却将所有的NULL值分在同一组,即认为它们是“相等”的。
HAVING子句
GROUP BY子句分组,只是简单地依据所选列的数据进行分组,将该列具有相同值的行划为一组。而实际应用中,往往还需要删除那些不能满足条件的行组,为了实现这个功能,SQL提供了HAVING子句。语法如下。
SELECT column, SUM(column)
FROM table
GROUP BY column
HAVING SUM(column) condition value
说明:HAVING通常与GROUP BY子句同时使用。当然,语法中的SUM()函数也可以是其他任何聚合函数。DBMS将HAVING子句中的搜索条件应用于GROUP BY子句产生的行组,如果行组不满足搜索条件,就将其从结果表中删除。
HAVING子句的应用
从TEACHER表中查询至少有两位教师的系及教师人数。
实现代码:
SQL 代码 复制
SELECT DNAME, COUNT(*) AS num_teacher
FROM TEACHER
GROUP BY DNAME
HAVING COUNT(*)>=2
HAVING子句与WHERE子句的区别
HAVING子句和WHERE子句的相似之处在于,它也定义搜索条件。但与WHERE子句不同,HAVING子句与组有关,而不是与单个的行有关。
1、如果指定了GROUP BY子句,那么HAVING子句定义的搜索条件将作用于这个GROUP BY子句创建的那些组。
2、如果指定WHERE子句,而没有指定GROUP BY子句,那么HAVING子句定义的搜索条件将作用于WHERE子句的输出,并把这个输出看作是一个组。
3、如果既没有指定GROUP BY子句也没有指定WHERE子句,那么HAVING子句定义的搜索条件将作用于FROM子句的输出,并把这个输出看作是一个组。
4、在SELECT语句中,WHERE和HAVING子句的执行顺序不同。在本书的.1.2节介绍的SELECT语句的执行步骤可知,WHERE子句只能接收来自FROM子句的输入,而HAVING子句则可以接收来自GROUP BY子句、WHERE子句和FROM子句的输入。
5)
-- group by .... with rollup 的使用
CREATE TABLE #test (
Name varchar(10)
, [procedure] CHAR(1)
, model varchar(5)
, quantity int);
INSERT intO #testSELECT ‘A‘, ‘1‘, ‘φ‘, 500
union ALLSELECT ‘A‘, ‘1‘, ‘φ‘, 600
union ALLSELECT ‘A‘, ‘1‘, ‘φ‘, 500
union ALLSELECT ‘A‘, ‘2‘, ‘φ‘, 700
union ALLSELECT ‘A‘, ‘2‘, ‘φ‘, 200
union ALLSELECT ‘B‘, ‘1‘, ‘φ‘, 1000;
SELECT
case WHEN GROUPING(Name) = 1 THEN ‘总计‘
WHEN GROUPING(Name) = 0 AND GROUPING([procedure]) = 1 THEN Name + ‘合计‘
WHEN GROUPING(Name) = 0 AND GROUPING([procedure]) = 0 AND GROUPING([model]) = 1 THEN Name + ‘的‘ + [procedure] + ‘小计‘
else Name end AS Name
, case WHEN GROUPING([model]) = 1 THEN ‘‘ else [procedure] end AS [procedure]
, isnull(model, ‘‘) AS model
, sum(quantity) AS quantity
FROM #test
group by Name, [procedure], model with rollup
procedure model quantity----------------- --------- ----- ----------
-A 1 φ 500
A 1 φ 1100
A的小计 1600
A 2 φ 200
A 2 φ 700
A的小计 900
A合计 2500
B 1 φ 1000
B的小计 1000
B合计 1000
总计 3500
CUBE运算符生成的结果集是多维数据集,多维数据集是事实数据的扩展,事实数据即记录个别时间的数据,扩展建立在用户准备分析的列上,这些列被称为维,多维数据集是一个结果集,其中包含各纬度所有可能的交叉表格.
CUBE运算符是在Select语句的group by子句中指定的,group by应指定维度列和关键字with cube,结果集将包括维度列中各值的所有可能组合.
示例1.
Sql语句如下:
select * from student
select sex,sclass,sum(score) as 合计
from student
group by sex,sclass with cube
select sex,sclass,sum(score) as 合计
from student
group by sclass,sex with cube
Sql查询时这样运行:
1. 查询到性别的第一个性别为男,则先查询男生,然后分班级
2. 查询完成之后,对性别为Sex为男的数据进行合计
3. 查询性别为女的数据,查询完成之后同样也进行合计
4. 不分性别、班级进行合计汇总
5. 以上均是以性别为组来分类,因为至此时关于性别的所有汇总都已经完成
6. 按照sclass进行分组汇总.
注意:
1. 分类依据并不是根据select 中的顺序,而是根据group by中的顺序.
2. 尽量按照使select和group by中的字段顺序一致,这样在显示起来看着更舒服,具体情况具体分析.
对于上述查询的结果,我们可以看出,数据中存在空置问题,绑定到GridView后显示如下:
此中效果并没有达到能够满足实际项目中的需要,所以,我们对Sql语句应进行改进.
使用Grouping区分空值.
如何区分使用CUBE之后产生的空值和实际查询中得到的空值.这个问题可以用grouping函数来解决.如果列中的值来来自查询数据,则grouping返回0,如果列中的值是cube产生的空值,则返回1
示例2.
Sql如下:
select case when(grouping(sex)=1) then ‘小记‘ else sex
end as 性别,
case when(grouping(sclass)=1) then ‘小记‘ else sclass
end as 班级,
sum(score)
from student
group by sex,sclass with cube
在页面上显示时如下:
CUBE可以生成n维的多维数据集,即具有任意维目的多维数据集,只有一个维度的多维数据集可用于生成合计.
示例3:
SQL:
select case when(grouping(sex)=1) then ‘合计‘ else sex end as 性别,
sum(score) as 合计
from student
group by sex with cube
生成许多维度的数据集合结果可能很大,办法就是生成一个大的视图,选择显示即可.
文章出处:http://www.studyofnet.com/news/247.html
以上是关于在SQL中分组查询 Group by 的存在条件是啥的主要内容,如果未能解决你的问题,请参考以下文章
SQL语句之order by group byhavingwhere
SQL中的Group By的查询过程多列分组的查询过程是怎样的?