SQL嵌套子查询和相关子查询的执行过程有啥区别

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SQL嵌套子查询和相关子查询的执行过程有啥区别相关的知识,希望对你有一定的参考价值。

SQLServer子查询可以分为 相关子查询 和 嵌套子查询 两类。前提,假设Books表如下:类编号 图书名 出版社 价格
--------------------------------------------------------
2 c#高级应用 圣通出版 23.00
2 Jsp开发应用 机械出版社 45.00
3 高等数学 济南出版社 25.00
3 疯狂英语 清华大学出版社 32.00   嵌套子查询的执行不依赖与外部的查询。执行过程:(1)执行子查询,其结果不被显示,而是传递给外部查询,作为外部查询的条件使用。(2)执行外部查询,并显示整个结果。  嵌套子查询一般可以分为:返回 单值的子查询 和 返回一个列表的子查询 ,下面举例说明:1.返回单值: --查询所有价格高于平均价格的图书名,作者,出版社和价格。 USE tempdb
GO

SElECT 图书名,作者,出版社,价格
FROM Books
WHERE 价格 >
(
SELECT AVG(价格)
FROM Books
)
GO2.返回值列表--查询所有借阅图书的读者信息 SElECT *
FROM Readers
WHERE 读者编号 IN
(
SELECT 读者编号
FROM [Borrow History]
)
GO  相关子查询的执行依赖于外部查询。多数情况下是子查询的WHERE子句中引用了外部查询的表。执行过程:(1)从外层查询中取出一个元组,将元组相关列的值传给内层查询。(2)执行内层查询,得到子查询操作的值。(3)外查询根据子查询返回的结果或结果集得到满足条件的行。(4)然后外层查询取出下一个元组重复做步骤1-3,直到外层的元组全部处理完毕。   下面举例说明:--查询Booka表中大于该类图书价格平均值的图书信息SElECT 图书名,出版社,类编号,价格
FROM Books As a
WHERE 价格 >
(
SELECT AVG(价格)
FROM Books AS b
WHERE a.类编号=b.类编号
)
GO
与前面介绍过的子查询不同,相关子查询无法独立于外部查询而得到解决。该子查询需要一个“类编号”的值。而这个值是个变量,随SQLSever检索Books表中的不同行而改变。下面详细说明该查询执行过程:
  先将Books表中的第一条记录的“类编号”的值“2”代入子查询中,子查询变为:
      SELECT AVG(价格)
       FROM Books AS b
     WHERE b.类编号=2
  子查询的结果为该类图书的平均价格,所以外部查询变为:
      SElECT 图书名,出版社,类编号,价格
       FROM Books As a
     WHERE 价格 > 34
如果WHERE条件为True,则第一条结果包括在结果集中,则否不包括。对Books表中的所有行运行相同的过程,最后形成的结果集及最后返回结果。
参考技术A SQLServer子查询可以分为 相关子查询 和 嵌套子查询 两类
嵌套子查询的执行不依赖与外部的查询:
执行过程:
(1)执行子查询,其结果不被显示,而是传递给外部查询,作为外部查询的条件使用。
(2)执行外部查询,并显示整个结果。  
嵌套子查询一般可以分为:返回单值的子查询 和 返回一个列表的子查询
相关子查询的执行依赖于外部查询:多数情况下是子查询的WHERE子句中引用了外部查询的表。
执行过程:
(1)从外层查询中取出一个元组,将元组相关列的值传给内层查询。
(2)执行内层查询,得到子查询操作的值。
(3)外查询根据子查询返回的结果或结果集得到满足条件的行。
(4)然后外层查询取出下一个元组重复做步骤1-3,直到外层的元组全部处理完毕。  

SQL 查询优化(嵌套子查询)

【中文标题】SQL 查询优化(嵌套子查询)【英文标题】:SQL query optimization (nested subqueries) 【发布时间】:2012-12-02 20:13:09 【问题描述】:

我需要写一个查询:

找出已发行电影的平均评分之间的差异 1980 年之前和 1980 年之后发行的电影的平均评分。 (确保计算每部电影的平均评分,然后 1980 年之前的电影和之后的电影的平均值。 不要只计算前后的整体平均评分 1980 年。)

架构如下:

Movie ( mID, title, year, director )
English: There is a movie with 
ID number mID, a title, a release year, and a director.

Reviewer ( rID, name )
English: The reviewer with ID number rID has a certain name.

Rating ( rID, mID, stars, ratingDate )
English: The reviewer rID gave the movie mID a 
number of stars rating (1-5) on a certain ratingDate. 

以下是我提出的查询。结果是正确的,但绝对不是一个很好的查询:

    select t1.p1-t2.p2 from
    (select avg(average) as p1  from 
    (select g.mid,g.average, year from
    (select mid, avg(stars) as average from rating
    group by mid) g, movie
    where g.mid=movie.mid) j 
    where year >= 1980) t1,

    (select avg(average) as p2  from 
    (select g.mid,g.average, year from
    (select mid, avg(stars) as average from rating
    group by mid) g, movie
    where g.mid=movie.mid) j 
    where year < 1980) t2;

以下是我如何得出这个查询。 首先,我编写了这个子查询来检索电影 id、该电影的平均评分、电影年份:

    select g.mid,g.average, year from
    (select mid, avg(stars) as average from rating
    group by mid) g, movie
    where g.mid=movie.mid  

现在我需要使用相同的子查询来创建两个表,其中第一个表包含 1980 年之后电影的平均评分。第二个包含 1980 年之前电影的平均评分。在***查询中,我减去这 2 个价值观。

问题是我在两个地方复制了相同的代码。您能否从代码重复的角度以及性能的角度帮助优化代码?

【问题讨论】:

你想优化什么,效率还是优雅?如果你想要效率,你正在使用的 DBMS 是必需的。并非所有 SQL 都是一样的。 【参考方案1】:

你可以这样做,而无需像这样重复:

Select
  Avg(Case When m.Year >= 1980 Then a.stars Else Null End) -
  Avg(Case When m.Year < 1980 Then a.stars Else Null End)
From (
    Select
      mid,
      avg(stars) stars
    From 
      rating
    Group By
      mid
  ) a 
    inner join
  movie m
    on m.mid = a.mid

您可能希望将内部查询移至视图或公用表表达式 (CTE)。根据您使用的 dbms,您可能需要将星号转换为十进制类型,或者您可能会以整数运算获得所有内容。

(mid, stars) 上的评级表索引将有助于提高性能。

Example Fiddle

【讨论】:

【参考方案2】:

试一试并假设 SQL Server,有几件事。索引非常重要,查询的编写方式也是如此。

一些 CREATE TABLE 语句

create table Movie ( mID int primary key clustered, title varchar(100), year int, director varchar(100) ) 

create table Reviewer ( rID int primary key clustered, name varchar(100) ) 

create table Rating ( rID int, mID int, stars int, ratingDate datetime , primary key clustered (rID, mID) ) 

我已经聚集在 Movie 表中的 mID 上,并且聚集在评级表中的 rID 和 mID 字段上,不适合您的查询。

索引:SQL 需要获取电影的所有评分,因此评分表的更好的聚集键是 创建表 Rating ( rID int, mID int, stars int, ratingDate datetime , 主键聚集 (mID, rID) )

如果您无法更改此类内容,则至少创建一个按 mID 索引并包含 stars 列的覆盖索引。

接下来,您的查询...有几种方法可以编写它 - 最好查看查询计划输出。这是编写查询的一种方式

with 
    MovieAverage as (
        select mID, movieAvgStars = avg(stars)
        from Rating
        group by mID
        ),

    Pre1980 as (
        select MovieAvgStars = avg(  movieAvgStars )
        from MovieAverage
            inner join Movie
                on MovieAverage.mID = Movie.mID
        where Movie.year < 1980
        ),

    IncAndPost1980 as (
        select MovieAvgStars = avg(  movieAvgStars )
        from MovieAverage
            inner join Movie 
                on MovieAverage.mID = Movie.mID
        where Movie.year >= 1980
        )

select IncAndPost1980.MovieAvgStars - Pre1980.MovieAvgStars
from IncAndPost1980 cross JOIN Pre1980

可能还有其他调整方式,但没有样本数据等很难正确判断。

【讨论】:

【参考方案3】:

没有任何效率考虑,也没有考虑任何特定的 DBMS(无论如何,很少有人同时拥有 NATURAL 连接和 CTE):

; WITH g AS
    ( SELECT mid, AVG(stars) AS average 
      FROM rating
      GROUP BY mid
    ) 
  , j AS
    ( SELECT mid, average, year 
      FROM g NATURAL JOIN movie
    )
  , t1 AS
    ( SELECT AVG(average) AS p1 
      FROM j
      WHERE year >= 1980
    )
  , t2 AS
    ( SELECT AVG(average) AS p2 
      FROM j
      WHERE year < 1980
    )
  SELECT t1.p1 - t2.p2 AS result
  FROM t1 CROSS JOIN t2 
;

【讨论】:

以上是关于SQL嵌套子查询和相关子查询的执行过程有啥区别的主要内容,如果未能解决你的问题,请参考以下文章

子查询(嵌套子查询)

求SQL相关子查询和嵌套子查询通俗的区别 ?

SQL相关子查询和嵌套子查询的区别

相关子查询 与 嵌套子查询 有何区别 ?

关于SQL DELETE嵌套子查询问题

SQL Server 之 子查询与嵌套查询