使用子查询
Posted 霖行
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用子查询相关的知识,希望对你有一定的参考价值。
使用子查询
本章介绍什么是子查询以及如何使用它们。
子查询
SELECT语句是SQL的查询,目前我们用的所有SELECT语句都是从单个数据库表中检索数据的单条简单语句。
- 查询(query) 任何SQL语句都是查询。但此术语一般指SELECT语句。
SQL还允许创建子查询(subquery),即嵌套在其他查询中的查询。
利用子查询进行过滤
检索出订购物品TNT2的所有客户的步骤:
- 检索包含物品TNT2的所有订单编号。
- 检索具有前一步列出的订单编号的所有客户的ID。
- 检索前一步列出的客户ID的客户信息。
以上步骤都可以单独作为一个查询来执行。可以把一条SELECT语句返回的结果用于另一条SELECT语句的WHERE子句。也可以使用子查询把3个查询组合成一条语句。
步骤1:检索prod_id为TNT2的order_num值
mysql> SELECT order_num
-> FROM orderitems
-> WHERE prod_id = 'TNT2';
+-----------+
| order_num |
+-----------+
| 20005 |
| 20007 |
+-----------+
2 rows in set (0.02 sec)
步骤2:查询具有订单20005和20007的客户ID
mysql> SELECT cust_id
-> FROM orders
-> WHERE order_num IN (20005,20007);
+---------+
| cust_id |
+---------+
| 10001 |
| 10004 |
+---------+
2 rows in set (0.01 sec)
利用子查询合并步骤1和2:
mysql> SELECT cust_id
-> FROM orders
-> WHERE order_num IN (SELECT order_num
-> FROM orderitems
-> WHERE prod_id = 'TNT2');
+---------+
| cust_id |
+---------+
| 10001 |
| 10004 |
+---------+
2 rows in set (0.01 sec)
在SELECT语句中,子查询总是从内向外处理。
步骤3:检索这些客户ID的客户信息:
mysql> SELECT cust_name, cust_contact
-> FROM customers
-> WHERE cust_id IN (10001,10004);
+----------------+--------------+
| cust_name | cust_contact |
+----------------+--------------+
| Coyote Inc. | Y Lee |
| Yosemite Place | Y Sam |
+----------------+--------------+
2 rows in set (0.01 sec)
利用子查询合并步骤1、2和3:
mysql> SELECT cust_name, cust_contact
-> FROM customers
-> WHERE cust_id IN (SELECT cust_id
-> FROM orders
-> WHERE order_num IN (SELECT order_num
-> FROM orderitems
-> WHERE prod_id = 'TNT2'));
+----------------+--------------+
| cust_name | cust_contact |
+----------------+--------------+
| Coyote Inc. | Y Lee |
| Yosemite Place | Y Sam |
+----------------+--------------+
2 rows in set (0.01 sec)
为了执行此SELECT语句,MySQL实际上必须执行3条SELECT语句。最外层查询确实返回所需数据。
在WHERE子句中使用子查询能够编写出功能很强并且很灵活的SQL语句。对于能嵌套的子查询的数目没有限制,但由于性能的限制,不能嵌套太多的子查询。
虽然子查询一般与IN操作符结合使用,但也可以用于测试等于(=),不等于(<>)等。
- 格式化SQL 包含子查询的SELECT语句难以阅读和调试。我们把子查询分解为多行并且适当的缩进,能极大的简化子查询的使用。
- 列必须匹配 使用子查询时,应保证SELECT语句具有与WHERE子句中相同数目的列。
- 子查询和性能 由于需要多次查询,使用子查询并不总是执行这种类型的数据检索的最有效的方法。
作为计算字段使用子查询
使用子查询的另一方法是创建计算字段。
检索customers表中每个客户的订单总数步骤:
- 从customers表中检索客户列表。
- 对于检索出的每个客户,统计其在orders表中的订单数目。
可使用SELECT COUNT(*)对表中的行进行计数,可通过WHERE来过滤客户。
对客户10001的订单进行计数:
mysql> SELECT COUNT(*) AS orders
-> FROM orders
-> WHERE cust_id = 10001;
+--------+
| orders |
+--------+
| 2 |
+--------+
1 row in set (0.00 sec)
为对每个客户进行COUNT(*)计算,应将COUNT(*)作为子查询:
mysql> SELECT cust_name,
-> cust_state,
-> (SELECT COUNT(*)
-> FROM orders
-> WHERE orders.cust_id = customers.cust_id) AS orders
-> FROM customers
-> ORDER BY cust_name;
+----------------+------------+--------+
| cust_name | cust_state | orders |
+----------------+------------+--------+
| Coyote Inc. | MI | 2 |
| E Fudd | IL | 1 |
| Mouse House | OH | 0 |
| Wascals | IN | 1 |
| Yosemite Place | AZ | 1 |
+----------------+------------+--------+
5 rows in set (0.01 sec)
此SELECT语句对customers表中每个客户返回3列:cust_name、cust_state和orders。orders是一个计算字段,它由圆括号中的子查询建立的。该子查询对检索出的每个客户执行一次。
子查询中的WHERE子句使用了完全限定列名(MySQL必知必会——第四章检索数据),这告诉SQL比较orders表中的cust_id和当前的customers表中检索的cust_id。
- 相关子查询(correlated subquery) 涉及外部查询的子查询。
这种子查询称为相关子查询。任何时候只有列名可能有多义性,就必须使用这种语法(表名和列名由一个句点分隔)。
不使用完全限定列名:
mysql> SELECT cust_name,
-> cust_state,
-> (SELECT COUNT(*)
-> FROM orders
-> WHERE cust_id = cust_id) AS orders
-> FROM customers
-> ORDER BY cust_name;
+----------------+------------+--------+
| cust_name | cust_state | orders |
+----------------+------------+--------+
| Coyote Inc. | MI | 5 |
| E Fudd | IL | 5 |
| Mouse House | OH | 5 |
| Wascals | IN | 5 |
| Yosemite Place | AZ | 5 |
+----------------+------------+--------+
5 rows in set (0.01 sec)
很显然,不返回预期结果。在子查询中,存在两个cust_id列,一个在customers中,一个在orders中。如果不完全限定列名,MySQL将假定cust_id是orders表中的cust_id,这形成了自身比较。
虽然子查询有时很有用,但必须注意限制有歧义性的列名。
- 不止一种解决方案 虽然样例代码运行良好,但它并非解决这种数据检索的最有效的方法。
- 逐渐增加子查询来建立查询 用子查询测试和调试查询很有技巧性。用子查询建立查询最可靠的方法是逐渐进行,由内到外,逐步测试。这样节省了以后找错误的大量时间,并且提高了查询一开始就正常工作的可能。
以上是关于使用子查询的主要内容,如果未能解决你的问题,请参考以下文章
如何在子查询中使用 select 语句? (Postgres)