SQL关联查询详解,SQL JOIN详解

Posted 清风拂来水波不兴

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL关联查询详解,SQL JOIN详解相关的知识,希望对你有一定的参考价值。

关联查询,也称为多表查询,指两个或更多个表一起完成查询操作。 前提条件:这些一起查询的表之间是有关系的(一对一、一对多),它们之间一定是有关联字段,这个关联字段可能建立了外键,也可能没有建立外键。

一、错误案例引入问题

1.案例说明

先来看几个简单的表,如下:

emp表:职工表,关联dept表

dept表:部门表,关联location表

location表:部门地区表

此时我们需要查询到员工的姓名及其部门名称:

如果我们错误的使用到下面的语句的话:

SELECT *
from emp,dept

得到结果如下:一共20条数据,它是对应emp的4条记录×dept的5条记录 

 我们把上述多表查询中出现的问题称为:笛卡尔积的错误。

2.笛卡尔积(或交叉连接)的理解

笛卡尔乘积是一个数学运算。假设我有两个集合 X 和 Y,那么 X 和 Y 的笛卡尔积就是 X 和 Y 的所有可能的组合,也就是第一个对象来自于 X,第二个对象来自于 Y 的所有可能。组合的个数即为两个集合中元素个数的乘积数。

SQL92中,笛卡尔积也称为交叉连接 ,英文是 CROSS JOIN 。在 SQL99 中也是使用 CROSS JOIN表示交叉连接。它的作用就是可以把任意表进行连接,即使这两张表不相关

mysql中如下情况会出现笛卡尔积:

select * from emp,dept
select * from emp cross join dept
select * from emp inner join dept
select * from emp join dept

inner join为内连接,等于join(省略了inner),内连接后面可以不接on

在上面的例子中笛卡尔积的不适应主要在于:emp表和dept表没有指明关联关系,导致表中的所有行互相连接

为了避免笛卡尔积错误,可以在where加上有效的连接条件,如下:

select *
from emp,dept
where emp.dept_id = dept.id

结果如下:

可以和前面的笛卡尔积错误的结果进行比较,该sql语句表示从笛卡尔积的结果中筛选出想要的数据(员工的部门id等于部门id)。

因为如此,陈七的部门id为null,在笛卡尔积中找不出陈七的部门id和哪个部门对应,所有没有出现在结果集中,这是内连接的一个特性。

也可以n张表进行连接,如在上面的例子进行扩充,求出每个员工的工作地点,需要连接三张表,只需用and连接上条件即可。

select *
from emp,dept,location
where emp.dept_id = dept.id and dept.location_id = location.id

二、多表查询的分类

关联查询可分为如下几类:

  • 等值连接和非等值连接
  • 自连接非自连接
  • 内连接外连接

我们需要根据需求去选择不同种类的连接查询

1.等值连接和非等值连接

等值连接就是前面的案例中,员工表的部门id与部门表的id呈现一个相等的状态,侧重于相等,所以叫等值连接。而非等值连接不是相等的情况。

来看一个非等值连接的情况:

如下两张表,需要求每个学生的成绩对应的等级

 代码如下:

select name,grade,level
from student,score
where student.grade between score.lowest_grade and score.greatest_grede

 该关联查询没有使用的关联条件不是=,而是其他的条件,被称为非等值连接。

2.自连接和非自连接

前面的员工表关联部门表进行查询就是非自连接,连接的其它表;而自连接就是连接当前表。

例子:上面的emp表有一个manager_id的字段,表示它的管理者id,同样的管理者同样也是员工,也是记录也在emp表中的,所以为了求出每个员工的管理者,就需要自连接:

select concat(e1.name,'为',e2.name,'工作')
from emp e1,emp e2
where e1.manager_id = e2.id

结果: 

自连接:当table1和table2本质上是同一张表,只是用取别名的方式虚拟成两张表以代表不同的意义。然后两个表再进行内连接,外连接等查询。

3.内连接和外连接

  • 内连接: 合并具有同一列的两个以上的表的行, 结果集中不包含一个表与另一个表不匹配的行
  • 外连接: 两个表在连接过程中除了返回满足连接条件的行以外还返回左(或右)表中不满足条件的行 ,这种连接称为左(或右)外连接。没有匹配的行时,结果表中相应的列为空(NULL)。

如果是左外连接,则连接条件中左边的表也称为主表 ,右边的表称为从表 。 如果是右外连接,则连接条件中右边的表也称为主表 ,左边的表称为从表 。

初步认识

在前面的例子中,我们使用到的是内连接:

#查询到所有员工的部门名,内连接的写法之一
SELECT emp.name,dept.name
from emp,dept
where emp.dept_id=dept.id

结果如下: 

 但是你会发现,少了个员工,这是因为该员工的部门id为空,在部门表中并没有相应的数据,又因为是内连接,所有该员工不会出现在结果里。

 要想解决该问题,就需要使用外连接。使员工表为主表,左外连接部门表:

得到的结果为:

 如果使用右外连接,结果为:

 也就是说部门表中所有的记录都会匹配出,尽管有些部门没有任何的员工,也列出来。

这是左外连接和右外连接的一个区别。

三、实现多表查询的语法

使用JOIN...ON子句创建连接的语法结构:

SELECT table1.column, table2.column,table3.column
FROM table1
    JOIN table2 ON table1 和 table2 的连接条件
        JOIN table3 ON table2 和 table3 的连接条件

语法说明:

  • 可以使用 ON 子句指定额外的连接条件。
  • 这个连接条件是与其它条件分开的。
  • ON 子句使语句具有更高的易读性。
  • 关键字 JOININNER JOIN、CROSS JOIN 的含义是一样的,都表示内连接。

1.内连接(INNER JOIN)的实现

语法:

SELECT 字段列表
FROM A表 INNER JOIN B表
ON 关联条件
WHERE 等其他子句;

例子:使用新的语法替换之前的查询员工操作,要求没有部门的员工不显示出来:

SELECT emp.name,dept.name
from emp
inner join dept
on emp.dept_id = dept.id

2.外连接(OUTER JOIN)的实现

2.1左外连接

语法:

#实现查询结果是A
SELECT 字段列表
FROM A表 LEFT OUTER JOIN B表
ON 关联条件
WHERE 等其他子句;

OUTER关键字可省略。

例子:查询所有员工的工作地点,没有部门的员工照样显示出来。

SELECT emp.name,dept.name,location.region
from emp left outer join dept
on emp.dept_id = dept.id
	left join location
	on dept.location_id = location.id

2.2右外连接(RIGHT OUTER JOIN)

语法:

SELECT 字段列表
FROM A表 RIGHT JOIN B表
ON 关联条件
WHERE 等其他子句;

例子:查询员工的部门信息,没有部门的员工不显示,但是把没有员工对应的部门也显示出来。

SELECT emp.name,dept.name
from emp right join dept
on emp.dept_id = dept.id

结果:

3.满外连接(FULL OUTER JOIN)

还有一种外连接结合了左外连接和右外连接的特点,称为满外连接:

  • 满外连接的结果 = 左右表匹配的数据 + 左表没有匹配到的数据 + 右表没有匹配到的数据
  • SQL99是支持满外连接的。使用FULL JOIN 或 FULL OUTER JOIN来实现。
  • 需要注意的是,MySQL不支持FULL JOIN,但是可以用 LEFT JOIN UNION RIGHT JOIN代替。

四、UNION的使用

合并查询结果

利用UNION关键字,可以给出多条SELECT语句,并将它们的结果组合成单个结果集。合并时,两个表对应的列数和数据类型必须相同,并且相互对应。各个SELECT语句之间使用UNION或UNION ALL关键字分隔。

语法格式:

SELECT column,... FROM table1
UNION [ALL]
SELECT column,... FROM table2
  • UNION 操作符返回两个查询的结果集的并集,去除重复记录。
  • UNION ALL操作符返回两个查询的结果集的并集。对于两个结果集的重复部分,不去重。

注意:执行UNION ALL语句时所需要的资源比UNION语句少。如果明确知道合并数据后的结果数据不存在重复数据,或者不需要去除重复的数据,则尽量使用UNION ALL语句,以提高数据查询的效率

举例1:查询部门编号>90或邮箱包含a的员工信息

#方式1
SELECT * FROM employees WHERE email LIKE '%a%' OR department_id>90
#方式2
SELECT * FROM employees WHERE email LIKE '%a%'
UNION
SELECT * FROM employees WHERE department_id>90;

举例2:使用union实现满外连接(下面内容会使用union all加速查找)

SELECT emp.name,dept.name
from emp left join dept
on emp.dept_id = dept.id
union
select emp.name,dept.name
from emp right join dept
on emp.dept_id = dept.id

结果: 

 

五、7种SQL JOINS的实现

下图是两种表的连接查询图,它们插叙的结果各不相同。图中红色部分代表最后查询的结果。

 

1.代码实现

  • 中图:内连接 A∩B,只取公共部分
select emp.name,dept.name
from emp inner join dept
on dept_id = dept.id
  • 左上图:左外连接,取左表的所有记录,并有条件的连接右表记录
select emp.name,dept.name
from emp left join dept
on dept_id = dept.id
  • 右上图:右外连接,取右表的所有记录,并有条件的连接左表记录
select emp.name,dept.name
from emp right join dept
on dept_id = dept.id
  • 左中图:A - A ∩ B
select emp.name,dept.name
from emp left join dept
on dept_id = dept.id
where dept.id is null   #去掉A∩B的部分
  • 右中图:B - A ∩ B
select emp.name,dept.name
from emp right join dept
on dept_id = dept.id
where emp.id is null   #或者dept_id is null
  • 左下图:是一个全连接,mysql不直接支持,但我们可以使用上面的union实现,但是根据上面的图,我们可以直接使用union all实现,增加效率。
    具体的:使用左上图 union all 右中图,或者右上图 union all 左中图都行。
select emp.name,dept.name   #左外连接取 A+(A∩B)
from emp left join dept
on emp.dept_id = dept.id
union all      #没有去重操作,效率高
select emp.name,dept.name   #右外连接取 B-(A∩B)
from emp right join dept
on emp.dept_id = dept.id
where emp.id is null
  • 右下图:A ∪B- A ∩ B
    使用左中图和右中图结合起来即可
select emp.name,dept.name   
from emp left join dept
on emp.dept_id = dept.id
where dept.id is null
union all
select emp.name,dept.name  
from emp right join dept
on emp.dept_id = dept.id
where emp.id is null

六、SQL99语法新特性

1.自然连接

SQL99 在 SQL92 的基础上提供了一些特殊语法,比如 NATURAL JOIN 用来表示自然连接。我们可以把自然连接理解为SQL92中的等值连接它会帮你自动查询两张连接表中所有相同的字段,然后进行等值连接

在SQL92标准中:

SELECT employee_id,last_name,department_name
FROM employees e JOIN departments d
ON e.`department_id` = d.`department_id`
AND e.`manager_id` = d.`manager_id`;

在 SQL99 中你可以写成:

SELECT employee_id,last_name,department_name
FROM employees e NATURAL JOIN departments d;

前提是字段名相同。

2.USING连接

当我们进行连接的时候,SQL99还支持使用 USING 指定数据表里的同名字段 进行等值连接。但是只能配合JOIN一起使用。比如:

SELECT employee_id,last_name,department_name
FROM employees e JOIN departments d
USING (department_id);

你能看出与自然连接 NATURAL JOIN 不同的是,USING 指定了具体的相同的字段名称,你需要在 USING 的括号 () 中填入要指定的同名字段。同时使用 JOIN...USING 可以简化 JOIN ON 的等值连接。它与下 面的 SQL 查询结果是相同的:

SELECT employee_id,last_name,department_name
FROM employees e ,departments d
WHERE e.department_id = d.department_id;

表连接的约束条件可以有三种方式:WHERE, ON, USING

  • WHERE:适用于所有关联查询
  • ON :只能和JOIN一起使用,只能写关联条件。虽然关联条件可以并到WHERE中和其他条件一起 写,但分开写可读性更好。
  • USING:只能和JOIN一起使用,而且要求两个关联字段在关联表中名称一致,而且只能表示关联字 段值相等

我们要控制连接表的数量 。多表连接就相当于嵌套 for 循环一样,非常消耗资源,会让 SQL 查询性能下降得很严重,因此不要连接不必要的表。在许多 DBMS 中,也都会有最大连接表的限制。

SQL中的left outer join,inner join,right outer join用法详解

 这两天,在研究SQL语法中的inner join多表查询语法的用法,通过学习,发现一个SQL命令,竟然涉及到很多线性代数方面的知识,现将这些知识系统地记录如下:

      使用关系代数合并数据
1 关系代数
合并数据集合的理论基础是关系代数,它是由E.F.Codd于1970年提出的。
在关系代数的形式化语言中:
?          用表、或者数据集合表示关系或者实体。
?          用行表示元组。
?          用列表示属性。
关系代数包含以下8个关系运算符
?          选取――返回满足指定条件的行。
?          投影――从数据集合中返回指定的列。
?          笛卡尔积――是关系的乘法,它将分别来自两个数据集合中的行以所有可能的方式进行组合。
?          并――关系的加法和减法,它可以在行的方向上合并两个表中的数据,就像把一个表垒在另一个表之上一样。
?          交――返回两个数据集合所共有的行。
?          差――返回只属于一个数据集合的行。
?          连接――在水平方向上合并两个表,其方法是:将两个表中在共同数据项上相互匹配的那些行合并起来。
?          除――返回两个数据集之间的精确匹配。
此外,作为一种实现现代关系代数运算的方法,SQL还提供了:
?          子查询――类似于连接,但更灵活;在外部查询中,方式可以使用表达式、列表或者数据集合的地方都可以使用子查询的结果。
本章将主要讲述多种类型的连接、简单的和相关的子查询、几种类型的并、关系除以及其他的内容。
2 使用连接
2.1 连接类型
在关系代数中,连接运算是由一个笛卡尔积运算和一个选取运算构成的。首先用笛卡尔积完成对两个数据集合的乘运算,然后对生成的结果集合进行选取运算,确保只把分别来自两个数据集合并且具有重叠部分的行合并在一起。连接的全部意义在于在水平方向上合并两个数据集合(通常是表),并产生一个新的结果集合,其方法是将一个数据源中的行于另一个数据源中和它匹配的行组合成一个新元组。
SQL提供了多种类型的连接方式,它们之间的区别在于:从相互交叠的不同数据集合中选择用于连接的行时所采用的方法不同。
连接类型          定义
内连接          只连接匹配的行
左外连接          包含左边表的全部行(不管右边的表中是否存在与它们匹配的行),以及右边表中全部匹配的行
右外连接          包含右边表的全部行(不管左边的表中是否存在与它们匹配的行),以及左边表中全部匹配的行
全外连接          包含左、右两个表的全部行,不管另外一边的表中是否存在与它们匹配的行。
(H)(theta)连接          使用等值以外的条件来匹配左、右两个表中的行
交叉连接          生成笛卡尔积-它不使用任何匹配或者选取条件,而是直接将一个数据源中的每个行与另一个数据源的每个行都一一匹配
在INFORMIX中连接表的查询
如果FROM子句指定了多于一个表引用,则查询会连接来自多个表的行。连接条件指定各列之间(每个表至少一列)进行连接的关系。因为正在比较连接条件中的列,所以它们必须具有一致的数据类型。
SELECT语句的FROM子句可以指定以下几种类型的连接
FROM子句关键字          相应的结果集
CROSS JOIN          笛卡尔乘积(所有可能的行对)
INNER JOIN          仅对满足连接条件的CROSS中的列
LEFT OUTER JOIN          一个表满足条件的行,和另一个表的所有行
RIGHT OUTER JOIN          与LEFT相同,但两个表的角色互换
FULL OUTER JOIN        LEFT OUTER 和 RIGHT OUTER中所有行的超集

2.2 内连接(Inner Join
内连接是最常见的一种连接,它页被称为普通连接,而E.FCodd最早称之为自然连接。
下面是ANSI SQL-92标准
select * 
from    t_institution i 
inner join t_teller t 
on i.inst_no = t.inst_no
where i.inst_no = "5801"
其中inner可以省略。
等价于早期的连接语法
select * 
from t_institution i, t_teller t 
where i.inst_no = t.inst_no
and i.inst_no = "5801"

2.3 外连接
2.3.1          左外连接(Left Outer Jion)
select * 
from    t_institution i 
left outer join t_teller t 
on i.inst_no = t.inst_no
其中outer可以省略。
2.3.2          右外连接(Rigt Outer Jion)
select * 
from    t_institution i 
right outer join t_teller t 
on i.inst_no = t.inst_no
2.3.3          全外连接(Full Outer)
全外连接返回参与连接的两个数据集合中的全部数据,无论它们是否具有与之相匹配的行。在功能上,它等价于对这两个数据集合分别进行左外连接和右外连接,然后再使用消去重复行的并操作将上述两个结果集合并为一个结果集。
在现实生活中,参照完整性约束可以减少对于全外连接的使用,一般情况下左外连接就足够了。在数据库中没有利用清晰、规范的约束来防范错误数据情况下,全外连接就变得非常有用了,你可以使用它来清理数据库中的数据。
select * 
from    t_institution i 
full outer join t_teller t 
on i.inst_no = t.inst_no
2.3.4          外连接与条件配合使用
当在内连接查询中加入条件是,无论是将它加入到join子句,还是加入到where子句,其效果是完全一样的,但对于外连接情况就不同了。当把条件加入到join子句时,SQL Server、Informix会返回外连接表的全部行,然后使用指定的条件返回第二个表的行。如果将条件放到where子句中,SQL Server将会首先进行连接操作,然后使用where子句对连接后的行进行筛选。下面的两个查询展示了条件放置位子对执行结果的影响:
条件在join子句
select * 
from    t_institution i 
left outer join t_teller t 
on i.inst_no = t.inst_no
and i.inst_no = “5801”
结果是:
inst_no      inst_name              inst_no      teller_no    teller_name
5801         天河区                 5801         0001         tom
5801         天河区                 5801         0002         david
5802         越秀区
5803         白云区
条件在where子句
select * 
from    t_institution i 
left outer join t_teller t 
on i.inst_no = t.inst_no
where i.inst_no = “5801”
结果是:
inst_no      inst_name              inst_no      teller_no    teller_name
5801         天河区                 5801         0001         tom
5801         天河区                 5801         0002         david

2.4 自身连接
自身连接是指同一个表自己与自己进行连接。这种一元连接通常用于从自反关系(也称作递归关系)中抽取数据。例如人力资源数据库中雇员与老板的关系。
下面例子是在机构表中查找本机构和上级机构的信息。
select s.inst_no superior_inst, s.inst_name sup_inst_name, i.inst_no, i.inst_name
from t_institution i
join t_institution s
on i.superior_inst = s.inst_no

结果是:
superior_inst sup_inst_name          inst_no      inst_name
800             广州市                 5801         天河区
800             广州市                 5802         越秀区
800             广州市                 5803         白云区

2.5 交叉(无限制) 连接
交叉连接用于对两个源表进行纯关系代数的乘运算。它不使用连接条件来限制结果集合,而是将分别来自两个数据源中的行以所有可能的方式进行组合。数据集合中一的每个行都要与数据集合二中的每一个行分别组成一个新的行。例如,如果第一个数据源中有5个行,而第二个数据源中有4个行,那么在它们之间进行交叉连接就会产生20个行。人们将这种类型的结果集称为笛卡尔乘积。
大多数交叉连接都是由于错误操作而造成的;但是它们却非常适合向数据库中填充例子数据,或者预先创建一些空行以便为程序执行期间所要填充的数据保留空间。
select *
from    t_institution i 
cross join t_teller t
在交叉连接中没有on条件子句
      通过以上知识,还真是系统地学习了一番,发现inner join其实可以通过最初的多表查询方式来实现,例如:

select * from    t_institution i ,t_teller t where i.inst_no = t.inst_no and i.inst_no = "5801"

其实,inner join就是对多表查询的一种解决方案而已。而外连接,还是有其特定的用处的,实际上就相当于一个开区间,而内连接就是一个闭区间。

























































































































以上是关于SQL关联查询详解,SQL JOIN详解的主要内容,如果未能解决你的问题,请参考以下文章

Sql查询left join

SQL语句中LEFT JOIN和RIGHT JOIN 以及INNER JOIN的区别

SQL的各种连接Join详解

SQL中JOIN操作详解

SQL中JOIN操作详解

Sql中in和exists详解