SQL group by分组查询

Posted 自来云

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL group by分组查询相关的知识,希望对你有一定的参考价值。

 

本文导读:在实际SQL应用中,经常需要进行分组聚合,即将查询对象按一定条件分组,然后对每一个组进行聚合分析。创建分组是通过GROUP BY子句实现的。与WHERE子句不同,GROUP BY子句用于归纳信息类型,以汇总相关数据。GROUP BY的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理。

在SQL Server中使用的分组查询是ORDER BY子句,使用ORDER BY子句要同聚合函数配合使用才能完成分组查询,在SELECT查询的字段中如果字段没有使用聚合函数就必须出现在ORDER BY子句中(即SELECT后边的字段名要么出现在聚合函数中,要么在ORDER BY子句中使用)

在分组查询中还可以配合使用HAVING子句,定义查询条件。

使用group by进行分组查询

 

在使用group by关键字时,在select列表中可以指定的项目是有限制的,select语句中仅许以下几项:

 

〉被分组的列

〉为每个分组返回一个值得表达式,例如用一个列名作为参数的聚合函数

group by 有一个原则,就是 select 后面的所有列中,没有使用聚合函数的列,必须出现在 group by 后面(重要)

group by实例

实例一

数据表:

姓名 科目 分数

张三 语文 80

张三 数学 98

张三 英语 65

李四 语文 70

李四 数学 80

李四 英语 90

期望查询结果:

姓名 语文 数学 英语

张三 80 98 65

李四 70 80 90

代码

SQL 代码 复制

 

 create table testScore   

 (   

    tid int primary key identity(1,1),   

    tname varchar(30) null,   

    ttype varchar(10) null,   

    tscor int null  

 )   

 go   

 ---插入数据  

 insert into testScore values (‘张三‘,‘语文‘,80)   

 insert into testScore values (‘张三‘,‘数学‘,98)   

 insert into testScore values (‘张三‘,‘英语‘,65)   

 insert into testScore values (‘李四‘,‘语文‘,70)   

 insert into testScore values (‘李四‘,‘数学‘,80)   

 insert into testScore values (‘李四‘,‘英语‘,90)   

 

 

 select tname as ‘姓名‘ ,    

 max(case ttype when ‘语文‘ then tscor else 0 end) ‘语文‘,     

 max(case ttype when ‘数学‘ then tscor else 0 end) ‘数学‘,    

 max(case ttype when ‘英语‘ then tscor else 0 end) ‘英语‘    

 from testScore    

 group by tname

 

实例二

有如下数据:(为了看得更清楚,我并没有使用国家代码,而是直接用国家名作为Primary Key)

国家(country)

人口(population)

中国

600

美国

100

加拿大

100

英国

200

法国

300

日本

250

德国

200

墨西哥

50

印度

250

 

根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。

人口

亚洲

1100

北美洲

250

其他

700

代码

SQL 代码 复制

 

 SELECT  SUM(population),

         CASE country

                 WHEN ‘中国‘     THEN ‘亚洲‘

                 WHEN ‘印度‘     THEN ‘亚洲‘

                 WHEN ‘日本‘     THEN ‘亚洲‘

                 WHEN ‘美国‘     THEN ‘北美洲‘

                 WHEN ‘加拿大‘  THEN ‘北美洲‘

                 WHEN ‘墨西哥‘  THEN ‘北美洲‘

         ELSE ‘其他‘ END

 FROM    Table_A

 GROUP BY CASE country

                 WHEN ‘中国‘     THEN ‘亚洲‘

                 WHEN ‘印度‘     THEN ‘亚洲‘

                 WHEN ‘日本‘     THEN ‘亚洲‘

                 WHEN ‘美国‘     THEN ‘北美洲‘

                 WHEN ‘加拿大‘  THEN ‘北美洲‘

                 WHEN ‘墨西哥‘  THEN ‘北美洲‘

         ELSE ‘其他‘ END;

 

同样的,我们也可以用这个方法来判断工资的等级,并统计每一等级的人数。SQL代码如下;

SQL 代码 复制

 

 SELECT

         CASE WHEN salary <= 500 THEN ‘1‘

              WHEN salary > 500 AND salary <= 600  THEN ‘2‘

              WHEN salary > 600 AND salary <= 800  THEN ‘3‘

              WHEN salary > 800 AND salary <= 1000 THEN ‘4‘

         ELSE NULL END salary_class,

         COUNT(*)

 FROM    Table_A

 GROUP BY

         CASE WHEN salary <= 500 THEN ‘1‘

              WHEN salary > 500 AND salary <= 600  THEN ‘2‘

              WHEN salary > 600 AND salary <= 800  THEN ‘3‘

              WHEN salary > 800 AND salary <= 1000 THEN ‘4‘

         ELSE NULL END;

 

对于groupby后面一般都是跟一个列名,但在该例子中通过case语句使分组变得跟强大了。

实例三

有如下数据

 

国家(country)

性别(sex)

人口(population)

中国

1

340

中国

2

260

美国

1

45

美国

2

55

加拿大

1

51

加拿大

2

49

英国

1

40

英国

2

60

 

按照国家和性别进行分组,得出结果如下

国家

中国

340

260

美国

45

55

加拿大

51

49

英国

40

60

代码

SQL 代码 复制

 

 SELECT country,

        SUM( CASE WHEN sex = ‘1‘ THEN

                       population ELSE 0 END),  --男性人口

        SUM( CASE WHEN sex = ‘2‘ THEN

                       population ELSE 0 END)   --女性人口

 FROM  Table_A

 GROUP BY country;

 

GROUP BY子句中的NULL值处理

当GROUP BY子句中用于分组的列中出现NULL值时,将如何分组呢?SQL中,NULL不等于NULL(在WHERE子句中有过介绍)。然而,在GROUP BY子句中,却将所有的NULL值分在同一组,即认为它们是“相等”的。

HAVING子句

GROUP BY子句分组,只是简单地依据所选列的数据进行分组,将该列具有相同值的行划为一组。而实际应用中,往往还需要删除那些不能满足条件的行组,为了实现这个功能,SQL提供了HAVING子句。语法如下。

SELECT column, SUM(column)

FROM table

GROUP BY column

HAVING SUM(column) condition value

说明:HAVING通常与GROUP BY子句同时使用。当然,语法中的SUM()函数也可以是其他任何聚合函数。DBMS将HAVING子句中的搜索条件应用于GROUP BY子句产生的行组,如果行组不满足搜索条件,就将其从结果表中删除。

HAVING子句的应用

从TEACHER表中查询至少有两位教师的系及教师人数。

实现代码:

SQL 代码 复制

 

 SELECT DNAME, COUNT(*) AS num_teacher

 

 FROM TEACHER

 

 GROUP BY DNAME

 

 HAVING COUNT(*)>=2

 

HAVING子句与WHERE子句的区别

HAVING子句和WHERE子句的相似之处在于,它也定义搜索条件。但与WHERE子句不同,HAVING子句与组有关,而不是与单个的行有关。

1、如果指定了GROUP BY子句,那么HAVING子句定义的搜索条件将作用于这个GROUP BY子句创建的那些组。

2、如果指定WHERE子句,而没有指定GROUP BY子句,那么HAVING子句定义的搜索条件将作用于WHERE子句的输出,并把这个输出看作是一个组。

3、如果既没有指定GROUP BY子句也没有指定WHERE子句,那么HAVING子句定义的搜索条件将作用于FROM子句的输出,并把这个输出看作是一个组。

4、在SELECT语句中,WHERE和HAVING子句的执行顺序不同。在本书的.1.2节介绍的SELECT语句的执行步骤可知,WHERE子句只能接收来自FROM子句的输入,而HAVING子句则可以接收来自GROUP BY子句、WHERE子句和FROM子句的输入。

 

5)

-- group by  ....  with rollup 的使用

CREATE TABLE #test ( 

Name   varchar(10)

,  [procedure] CHAR(1)

,  model   varchar(5)

,  quantity  int);

INSERT intO #testSELECT  ‘A‘, ‘1‘, ‘φ‘,  500 

union ALLSELECT  ‘A‘, ‘1‘, ‘φ‘,  600 

union ALLSELECT  ‘A‘, ‘1‘, ‘φ‘, 500

union ALLSELECT  ‘A‘, ‘2‘, ‘φ‘,  700 

union ALLSELECT  ‘A‘, ‘2‘, ‘φ‘, 200 

union ALLSELECT  ‘B‘, ‘1‘, ‘φ‘,  1000;

 

 SELECT 

 case WHEN GROUPING(Name) = 1 THEN  ‘总计‘

      WHEN GROUPING(Name) = 0 AND GROUPING([procedure]) = 1 THEN  Name + ‘合计‘

      WHEN GROUPING(Name) = 0 AND GROUPING([procedure]) = 0 AND GROUPING([model]) = 1 THEN  Name + ‘的‘ + [procedure] +  ‘小计‘

      else  Name  end  AS  Name

 ,  case WHEN GROUPING([model]) = 1 THEN ‘‘ else [procedure]  end  AS  [procedure]

 ,  isnull(model, ‘‘) AS model

 ,  sum(quantity) AS quantity

 FROM  #test

 group by   Name,  [procedure], model with rollup

           

 procedure model quantity----------------- --------- ----- ----------

 -A                 1         φ          500

 A                 1         φ          1100

 A的小计                                    1600

 A                 2         φ          200

 A                 2         φ           700

 A的小计                                     900

 A合计                                      2500

 B                 1         φ          1000

 B的小计                                    1000

 B合计                                      1000

 总计                                       3500

CUBE运算符生成的结果集是多维数据集,多维数据集是事实数据的扩展,事实数据即记录个别时间的数据,扩展建立在用户准备分析的列上,这些列被称为维,多维数据集是一个结果集,其中包含各纬度所有可能的交叉表格.

CUBE运算符是在Select语句的group by子句中指定的,group by应指定维度列和关键字with cube,结果集将包括维度列中各值的所有可能组合.

示例1.

Sql语句如下:

select * from student

select sex,sclass,sum(score) as 合计

from student

group by sex,sclass with cube

 

 

select sex,sclass,sum(score) as 合计

from student

group by sclass,sex with cube

 

Sql查询时这样运行:

1. 查询到性别的第一个性别为男,则先查询男生,然后分班级

2. 查询完成之后,对性别为Sex为男的数据进行合计

3. 查询性别为女的数据,查询完成之后同样也进行合计

4. 不分性别、班级进行合计汇总

5. 以上均是以性别为组来分类,因为至此时关于性别的所有汇总都已经完成

6. 按照sclass进行分组汇总.

注意:

1. 分类依据并不是根据select 中的顺序,而是根据group by中的顺序.

2. 尽量按照使select和group by中的字段顺序一致,这样在显示起来看着更舒服,具体情况具体分析.

对于上述查询的结果,我们可以看出,数据中存在空置问题,绑定到GridView后显示如下:

 

此中效果并没有达到能够满足实际项目中的需要,所以,我们对Sql语句应进行改进.

使用Grouping区分空值.

如何区分使用CUBE之后产生的空值和实际查询中得到的空值.这个问题可以用grouping函数来解决.如果列中的值来来自查询数据,则grouping返回0,如果列中的值是cube产生的空值,则返回1

示例2.

Sql如下:

select case when(grouping(sex)=1) then ‘小记‘ else sex

end as 性别,

case when(grouping(sclass)=1) then ‘小记‘ else sclass

end as 班级,

sum(score)

from student

group by sex,sclass with cube

 

在页面上显示时如下:

 

CUBE可以生成n维的多维数据集,即具有任意维目的多维数据集,只有一个维度的多维数据集可用于生成合计.

示例3:

SQL:

select case when(grouping(sex)=1) then ‘合计‘ else sex end as 性别,

sum(score) as 合计

from student

group by sex with cube

 

生成许多维度的数据集合结果可能很大,办法就是生成一个大的视图,选择显示即可.

 文章出处:http://www.studyofnet.com/news/247.html

以上是关于SQL group by分组查询的主要内容,如果未能解决你的问题,请参考以下文章

SQL中的Group By的查询过程多列分组的查询过程是怎样的?

玩转SQL语句之group by 多字段分组查询与having子句,一篇解决你的疑惑!

sql-多表查询JOIN与分组GROUP BY

使用SQL语言了解Django ORM中的分组(group by)和聚合(aggregation)查询

Oracle_group by分组查询_深入

java使用elasticsearch分组进行聚合查询(group by)