读SQL进阶教程笔记06_外连接
Posted 躺柒
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了读SQL进阶教程笔记06_外连接相关的知识,希望对你有一定的参考价值。
1. SQL的弱点
1.1. SQL语句的执行结果转换为想要的格式
-
1.1.1. 格式转换
-
1.1.2. SQL语言本来就不是为了这个目的而出现的
-
1.1.3. SQL终究也只是主要用于查询数据的语言而已
1.2. 生成报表的功能
- 1.2.1. 窗口函数
1.3. SQL不是用来生成报表的语言,所以不建议用它来进行格式转换
- 1.3.1. 必要时考虑用外连接或CASE表达式来解决问题
2. 制作交叉表(行→列)
2.1. 示例
- 2.1.1.
- 2.1.1.1. --水平展开求交叉表(1):使用外连接
SELECT C0.name,
CASE WHEN C1.name IS NOT NULL THEN\'○\'ELSE NULL END AS "SQL入门",
CASE WHEN C2.name IS NOT NULL THEN\'○\'ELSE NULL END AS "UNIX基础",
CASE WHEN C3.name IS NOT NULL THEN\'○\'ELSE NULL END AS "Java中级"
FROM (SELECT DISTINCT name FROM Courses) C0 --这里的C0是侧栏
LEFT OUTER JOIN
(SELECT name FROM Courses WHERE course = \'SQL入门’) C1
ON C0.name = C1.name
LEFT OUTER JOIN
(SELECT name FROM Courses WHERE course = \'UNIX基础’) C2
ON C0.name = C2.name
LEFT OUTER JOIN
(SELECT name FROM Courses WHERE course = \'Java中级’) C3
ON C0.name = C3.name;
-
2.1.1.2. 一般情况下,外连接都可以用标量子查询替代
2.1.1.2.1. 需要增加或者减少课程时,只修改SELECT子句即可,代码修改起来比较简单
2.1.1.2.2. 利于应对需求变更,对于需要动态生成SQL的系统也是很有好处的
2.1.1.2.3. 性能不太好
-
2.1.1.3. --水平展开(2):使用标量子查询
SELECT C0.name,
(SELECT \'○\'
FROM Courses C1
WHERE course = \'SQL入门’
AND C1.name = C0.name) AS "SQL入门",
(SELECT \'○\'
FROM Courses C2
WHERE course = \'UNIX基础’
AND C2.name = C0.name) AS "UNIX基础",
(SELECT \'○\'
FROM Courses C3
WHERE course = \'Java中级’
AND C3.name = C0.name) AS "Java中级"
FROM (SELECT DISTINCT name FROM Courses) C0; --这里的C0是表侧栏
-
2.1.1.4. 嵌套使用CASE表达式
2.1.1.4.1. CASE表达式可以写在SELECT子句里的聚合函数内部,也可以写在聚合函数外部
2.1.1.4.2. 其实在SELECT子句里,聚合函数的执行结果也是标量值,因此可以像常量和普通列一样使用
2.1.1.4.3. 和标量子查询的做法一样简洁,也能灵活地应对需求变更
-
2.1.1.5. --水平展开(3):嵌套使用CASE表达式
SELECT name,
CASE WHEN SUM(CASE WHEN course = \'SQL入门’THEN 1 ELSE NULL END) = 1
THEN\'○\'ELSE NULL END AS "SQL入门",
CASE WHEN SUM(CASE WHEN course = \'UNIX基础’THEN 1 ELSE NULL END) = 1
THEN\'○\'ELSE NULL END AS "UNIX基础",
CASE WHEN SUM(CASE WHEN course = \'Java中级’THEN 1 ELSE NULL END) = 1
THEN\'○\'ELSE NULL END AS "Java中级"
FROM Courses
GROUP BY name;
3. 汇总重复项于一列(列→行)
3.1. 示例
- 3.1.1.
- 3.1.1.1. --列数据转换成行数据:使用UNION ALL
SELECT employee, child_1 AS child FROM Personnel
UNION ALL
SELECT employee, child_2 AS child FROM Personnel
UNION ALL
SELECT employee, child_3 AS child FROM Personnel;
- 3.1.1.2. 视图
CREATE VIEW Children(child)
AS SELECT child_1 FROM Personnel
UNION
SELECT child_2 FROM Personnel
UNION
SELECT child_3 FROM Personnel;
child
-----
一郎
二郎
三郎
春子
夏子
3.1.1.2.1. --获取员工子女列表的SQL语句(没有孩子的员工也要输出)
SELECT EMP.employee, CHILDREN.child
FROM Personnel EMP
LEFT OUTER JOIN Children
ON CHILDREN.child IN (EMP.child_1, EMP.child_2, EMP.child_3);
4. 制作嵌套式表侧栏
4.1. 示例
- 4.1.1.
- 4.1.2.
-
4.1.3. 结果
- 4.1.3.1.
- 4.1.4. --使用外连接生成嵌套式表侧栏:错误的SQL语句
SELECT MASTER1.age_class AS age_class,
MASTER2.sex_cd AS sex_cd,
DATA.pop_tohoku AS pop_tohoku,
DATA.pop_kanto AS pop_kanto
FROM (SELECT age_class, sex_cd,
SUM(CASE WHEN pref_name IN (’青森’, ’秋田’)
THEN population ELSE NULL END) AS pop_tohoku,
SUM(CASE WHEN pref_name IN (’东京’, ’千叶’)
THEN population ELSE NULL END) AS pop_kanto
FROM TblPop
GROUP BY age_class, sex_cd) DATA
RIGHT OUTER JOIN TblAge MASTER1--外连接1:和年龄层级主表进行外连接
ON MASTER1.age_class = DATA.age_class
RIGHT OUTER JOIN TblSex MASTER2--外连接2:和性别主表进行外连接
ON MASTER2.sex_cd = DATA.sex_cd;
- 4.1.4.1. --停在第1个外连接处时:结果里包含年龄层级为2的数据
SELECT MASTER1.age_class AS age_class,
DATA.sex_cd AS sex_cd,
DATA.pop_tohoku AS pop_tohoku,
DATA.pop_kanto AS pop_kanto
FROM (SELECT age_class, sex_cd,
SUM(CASE WHEN pref_name IN (’青森’, ’秋田’)
THEN population ELSE NULL END) AS pop_tohoku,
SUM(CASE WHEN pref_name IN (’东京’, ’千叶’)
THEN population ELSE NULL END) AS pop_kanto
FROM TblPop
GROUP BY age_class, sex_cd) DATA
RIGHT OUTER JOIN TblAge MASTER1
ON MASTER1.age_class = DATA.age_class;
-
4.1.5. 如果不允许进行两次外连接,那么调整成一次就可以了
-
4.1.6. 对于不支持CROSS JOIN语句的数据库,可以像FROM TblAge,TblSex这样不指定连接条件,把需要连接的表写在一起,其效果与交叉连接一样
-
4.1.7. 如果先生成主表的笛卡儿积再进行连接,很容易就可以完成
-
4.1.8. --使用外连接生成嵌套式表侧栏:正确的SQL语句
SELECT MASTER.age_class AS age_class,
MASTER.sex_cd AS sex_cd,
DATA.pop_tohoku AS pop_tohoku,
DATA.pop_kanto AS pop_kanto
FROM (SELECT age_class, sex_cd
FROM TblAge CROSS JOIN TblSex ) MASTER --使用交叉连接生成两张主表的笛卡儿积
LEFT OUTER JOIN
(SELECT age_class, sex_cd,
SUM(CASE WHEN pref_name IN (’青森’, ’秋田’)
THEN population ELSE NULL END) AS pop_tohoku,
SUM(CASE WHEN pref_name IN (’东京’, ’千叶’)
THEN population ELSE NULL END) AS pop_kanto
FROM TblPop
GROUP BY age_class, sex_cd) DATA
ON MASTER.age_class = DATA.age_class
AND MASTER.sex_cd = DATA.sex_cd;
5. 作为乘法运算的连接
5.1. 示例
- 5.1.1.
- 5.1.2. --解答(1):通过在连接前聚合来创建一对一的关系
SELECT I.item_no, SH.total_qty
FROM Items I LEFT OUTER JOIN
(SELECT item_no, SUM(quantity) AS total_qty
FROM SalesHistory
GROUP BY item_no) SH
ON I.item_no = SH.item_no;
-
5.1.2.1. 以商品编号为主键的临时视图
-
5.1.2.2. 无法利用索引优化查询
-
5.1.3. --解答(2):先进行一对多的连接再聚合
SELECT I.item_no, SUM(SH.quantity) AS total_qty
FROM Items I LEFT OUTER JOIN SalesHistory SH
ON I.item_no = SH.item_no 一对多的连接
GROUP BY I.item_no;
-
5.1.3.1. 代码更简洁
-
5.1.3.2. 没有使用临时视图,所以性能也会有所改善
5.2. 从行数来看,表连接可以看成乘法。因此,当表之间是一对多的关系时,连接后行数不会增加
6. 全外连接
6.1. FULL OUTER JOIN
6.2. 相当于求集合的和(UNION,也称并集)
- 6.2.1. 内连接相当于求集合的积(INTERSECT,也称交集)
6.3. 示例
- 6.3.1. --全外连接保留全部信息
SELECT COALESCE(A.id, B.id) AS id,
A.name AS A_name,
B.name AS B_name
FROM Class_A A FULL OUTER JOIN Class_B B
ON A.id = B.id;
- 6.3.1.1. --数据库不支持全外连接时的替代方案
SELECT A.id AS id, A.name, B.name
FROM Class_A A LEFT OUTER JOIN Class_B B
ON A.id = B.id
UNION
SELECT B.id AS id, A.name, B.name
FROM Class_A A RIGHT OUTER JOIN Class_B B
ON A.id = B.id;
6.3.1.1.1. 分别进行左外连接和右外连接,再把两个结果通过UNION合并起来
6.4. COALESCE是SQL的标准函数
- 6.4.1. 可以接受多个参数,功能是返回第一个非NULL的参数
6.5. 外连接的思想和集合运算很像,使用外连接可以实现各种集合运算
7. 用外连接求差集:B-A
7.1. 示例
- 7.1.1.
SELECT B.id AS id, B.name AS B_name
FROM Class_A A RIGHT OUTER JOIN Class_B B
ON A.id = B.id
WHERE A.name IS NULL;
7.2. 可以作为NOT IN和NOT EXISTS之外的另一种解法
7.3. 可能是差集运算中效率最高的
8. 用全外连接求异或集
8.1. SQL没有定义求异或集的运算符
8.2. 用集合运算符
-
8.2.1. (A UNION B) EXCEPT (A INTERSECT B)
-
8.2.2. (A EXCEPT B) UNION (B EXCEPT A)
-
8.2.3. 性能开销大
8.3. 示例
- 8.3.1.
SELECT COALESCE(A.id, B.id) AS id,
COALESCE(A.name , B.name ) AS name
FROM Class_A A FULL OUTER JOIN Class_B B
ON A.id = B.id
WHERE A.name IS NULL
OR B.name IS NULL;
9. 用外连接进行关系除法
9.1. 示例
- 9.1.1. --用外连接进行关系除法运算:差集的应用
SELECT DISTINCT shop
FROM ShopItems SI1
WHERE NOT EXISTS
(SELECT I.item
FROM Items I LEFT OUTER JOIN ShopItems SI2
ON I.item = SI2.item
AND SI1.shop = SI2.shop
WHERE SI2.item IS NULL) ;
读SQL进阶教程笔记03_自连接
1. 针对相同的表进行的连接
1.1. 相同的表的自连接和不同表间的普通连接并没有什么区别,自连接里的“自”这个词也没有太大的意义
1.2. 与多表之间进行的普通连接相比,自连接的性能开销更大
-
1.2.1. 特别是与非等值连接结合使用的时候
-
1.2.2. 用于自连接的列推荐使用主键或者在相关列上建立索引
2. 组合
2.1. 有顺序的有序对(ordered pair)
2.2. 无顺序的无序对(unordered pair)
3. 示例
3.1.
3.2. --用于获取可重排列的SQL语句
SELECT P1.name AS name_1, P2.name AS name_2
FROM Products P1, Products P2;
- 3.2.1. 可重排列,所以结果行数9
3.3. --用于获取排列的SQL语句
SELECT P1.name AS name_1, P2.name AS name_2
FROM Products P1, Products P2
WHERE P1.name <> P2.name;
- 3.3.1. 排除掉由相同元素构成的对,结果行数为排列6
3.4. --用于获取组合的SQL语句
SELECT P1.name AS name_1, P2.name AS name_2
FROM Products P1, Products P2
WHERE P1.name > P2.name;
- 3.4.1. 只与“字符顺序比自己靠前”的商品进行配对,结果行数为组合3
3.5. --用于获取组合的SQL语句:扩展成3列
SELECT P1.name AS name_1, P2.name AS name_2, P3.name AS name_3
FROM Products P1, Products P2, Products P3
WHERE P1.name > P2.name
AND P2.name > P3.name;
3.6. ">”和“<”等比较运算符不仅可以用于比较数值大小,也可以用于比较字符串(比如按字典序进行比较)或者日期
4. 删除重复行
4.1. 示例
-
4.1.1. --用于删除重复行的SQL语句(1):使用极值函数
DELETE FROM Products P1 WHERE rowid < ( SELECT MAX(P2.rowid) FROM Products P2 WHERE P1.name = P2. name AND P1.price = P2.price ) ;
- 4.1.1.1. Oracle数据库里的rowid
-
4.1.2. --用于删除重复行的SQL语句(2):使用非等值连接
DELETE FROM Products P1 WHERE EXISTS ( SELECT * FROM Products P2 WHERE P1.name = P2.name AND P1.price = P2.price AND P1.rowid < P2.rowid );
4.2. 如果从物理表的层面来理解SQL语句,抽象度是非常低的
4.3. “表”“视图”这样的名称只反映了不同的存储方法,而存储方法并不会影响到SQL语句的执行和结果
4.4. 无论表还是视图,本质上都是集合——集合是SQL能处理的唯一的数据结构
5. 查找局部不一致的列
5.1. 示例
-
5.1.1. --用于查找是同一家人但住址却不同的记录的SQL语句
SELECT DISTINCT A1.name, A1.address FROM Addresses A1, Addresses A2 WHERE A1.family_id = A2.family_id AND A1.address <> A2.address ;
-
5.1.2. --用于查找价格相等但商品名称不同的记录的SQL语句
SELECT DISTINCT P1.name, P1.price FROM Products P1, Products P2 WHERE P1.price = P2.price AND P1.name <> P2.name;
-
5.1.3. 如果改用关联子查询,就不需要DISTINCT了
6. 排序
6.1. 示例
-
6.1.1. --排序:使用窗口函数
SELECT name, price, RANK() OVER (ORDER BY price DESC) AS rank_1, DENSE_RANK() OVER (ORDER BY price DESC) AS rank_2 FROM Products;
-
6.1.1.1. 在出现相同位次后,rank_1跳过了之后的位次,rank_2没有跳过,而是连续排序
-
6.1.1.2. 依赖于具体数据库来实现的方法
-
-
6.1.2. --排序从1开始。如果已出现相同位次,则跳过之后的位次
SELECT P1.name, P1.price, (SELECT COUNT(P2.price) FROM Products P2 WHERE P2.price > P1.price) + 1 AS rank_1 FROM Products P1 ORDER BY rank_1;
-
6.1.2.1. 不依赖于具体数据库来实现的方法
-
6.1.2.2. 去掉标量子查询后边的+1,就可以从0开始给商品排序
-
6.1.2.3. 如果修改成COUNT(DISTINCT P2.price),那么存在相同位次的记录时,就可以不跳过之后的位次,而是连续输出(相当于DENSE_RANK函数)
-
7. 同心圆状的递归集合
7.1. 示例
- 7.1.1.
-
7.1.2. --排序:使用自连接
SELECT P1.name, MAX(P1.price) AS price, COUNT(P2.name) +1 AS rank_1 FROM Products P1 LEFT OUTER JOIN Products P2 ON P1.price < P2.price GROUP BY P1.name ORDER BY rank_1;
- 7.1.2.1. 外连接就是这样一个用于将第1名也存储在结果里的小技巧
-
7.1.3. --排序:改为内连接
SELECT P1.name, MAX(P1.price) AS price, COUNT(P2.name) +1 AS rank_1 FROM Products P1 INNER JOIN Products P2 ON P1.price < P2.price GROUP BY P1.name ORDER BY rank_1;
- 7.1.3.1. 没有比橘子价格更高的水果,所以它被连接条件P1.price < P2.price排除掉了
-
7.1.4. --不聚合,查看集合的包含关系
SELECT P1.name, P2.name FROM Products P1 LEFT OUTER JOIN Products P2 ON P1.price < P2.price;
以上是关于读SQL进阶教程笔记06_外连接的主要内容,如果未能解决你的问题,请参考以下文章