联结
SQL最强大的功能之一就是能在数据检索查询的执行中联结(join)
表。联结是利用SQL的 SELECT 能执行的最重要的操作,很好地理解联结
及其语法是学习SQL的一个极为重要的组成部分
外键(foreign key) 外键为某个表中的一列,它包含另一个表
的主键值,定义了两个表之间的关系
关系数据库的可伸缩性远比非关系数据库要好
可伸缩性(scale) 能够适应不断增加的工作量而不失败。设
计良好的数据库或应用程序称之为可伸缩性好(scale well)
为什么要使用联结
正如所述,分解数据为多个表能更有效地存储,更方便地处理,并
且具有更大的可伸缩性。但这些好处是有代价的。
如果数据存储在多个表中,怎样用单条 SELECT 语句检索出数据?
答案是使用联结。简单地说,联结是一种机制,用来在一条 SELECT
语句中关联表,因此称之为联结。使用特殊的语法,可以联结多个表返
回一组输出,联结在运行时关联表中正确的行
维护引用完整性 重要的是,要理解联结不是物理实体。换句
话说,它在实际的数据库表中不存在。联结由mysql根据需
要建立,它存在于查询的执行当中
创建联结
联结的创建非常简单,规定要联结的所有表以及它们如何关联即可
现在来看 FROM 子句。与以前的 SELECT 语句不一样,这条语句的 FROM
子句列出了两个表,分别是 vendors 和 products 。它们就是这条 SELECT
语句联结的两个表的名字。这两个表用 WHERE 子句正确联结, WHERE 子句
指示MySQL匹配 vendors 表中的 vend_id 和 products 表中的 vend_id
可 以 看 到 要 匹 配 的 两 个 列 以 vendors.vend_id 和 products.
vend_id 指定。这里需要这种完全限定列名,因为如果只给出 vend_id ,
则MySQL不知道指的是哪一个(它们有两个,每个表中一个)
完全限定列名 在引用的列可能出现二义性时,必须使用完
全限定列名(用一个点分隔的表名和列名)。如果引用一个
没有用表名限制的具有二义性的列名,MySQL将返回错误
WHERE子句的重要性
利用 WHERE 子句建立联结关系似乎有点奇怪,但实际上,有一个很充
分的理由。请记住,在一条 SELECT 语句中联结几个表时,相应的关系是
在运行中构造的。在数据库表的定义中不存在能指示MySQL如何对表进
行联结的东西。你必须自己做这件事情。在联结两个表时,你实际上做
的是将第一个表中的每一行与第二个表中的每一行配对。 WHERE 子句作为
过滤条件,它只包含那些匹配给定条件(这里是联结条件)的行。没有
WHERE 子句,第一个表中的每个行将与第二个表中的每个行配对,而不管
它们逻辑上是否可以配在一起。
笛卡儿积(cartesian product) 由没有联结条件的表关系返回
的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘
以第二个表中的行数
笛卡儿积不是我们所想要的
不要忘了 WHERE 子句 应该保证所有联结都有 WHERE 子句,否
则MySQL将返回比想要的数据多得多的数据。同理,应该保
证 WHERE 子句的正确性。不正确的过滤条件将导致MySQL返回
不正确的数据
叉联结 有时我们会听到返回称为叉联结(cross join)的笛卡
儿积的联结类型
内部联结
目前为止所用的联结称为等值联结(equijoin),它基于两个表之间的
相等测试。这种联结也称为内部联结。其实,对于这种联结可以使用稍
微不同的语法来明确指定联结的类型
此语句中的 SELECT 与前面的 SELECT 语句相同,但 FROM 子句不
同。这里,两个表之间的关系是 FROM 子句的组成部分,以 INNER
JOIN 指定。在使用这种语法时,联结条件用特定的 ON 子句而不是 WHERE
子句给出。传递给 ON 的实际条件与传递给 WHERE 的相同。
使用哪种语法 ANSI SQL规范首选 INNER JOIN 语法。此外,
尽管使用 WHERE 子句定义联结的确比较简单,但是使用明确的
联结语法能够确保不会忘记联结条件,有时候这样做也能影响
性能。
联结多个表
SQL对一条 SELECT 语句中可以联结的表的数目没有限制。创建联结
的基本规则也相同。首先列出所有表,然后定义表之间的关系
此例子显示编号为 20005 的订单中的物品。订单物品存储在
orderitems 表中。每个产品按其产品ID存储,它引用 products
表中的产品。这些产品通过供应商ID联结到 vendors 表中相应的供应商,
供应商ID存储在每个产品的记录中。这里的 FROM 子句列出了3个表,而
WHERE 子句定义了这两个联结条件,而第三个联结条件用来过滤出订单
20005 中的物品
性能考虑 MySQL在运行时关联指定的每个表以处理联结。
这种处理可能是非常耗费资源的,因此应该仔细,不要联结
不必要的表。联结的表越多,性能下降越厉害
子查询并不总是执行复杂 SELECT 操作的最有效的
方法,下面是使用联结的相同查询
这个查询中返回数据需要使用3个表。但这里
我们没有在嵌套子查询中使用它们,而是使用了两个联结。这
里有3个 WHERE 子句条件。前两个关联联结中的表,后一个过滤产品 TNT2
的数据。
多做实验 正如所见,为执行任一给定的SQL操作,一般存在
不止一种方法。很少有绝对正确或绝对错误的方法。性能可能
会受操作类型、表中数据量、是否存在索引或键以及其他一些
条件的影响。因此,有必要对不同的选择机制进行实验,以找
出最适合具体情况的方法
联结是SQL中最重要最强大的特性,有效地使用联结需要对关系数据
库设计有基本的了解。本章随着对联结的介绍讲述了关系数据库设计的
一些基本知识,包括等值联结(也称为内部联结)这种最经常使用的联
结形式。