SQL Server - Exists 的替代方案(子查询太多)

Posted

技术标签:

【中文标题】SQL Server - Exists 的替代方案(子查询太多)【英文标题】:SQL Server - Alternative to Exists (too many subqueries) 【发布时间】:2018-09-20 16:11:42 【问题描述】:

我正在寻找一种方法来提高具有太多现有链接子查询的查询的性能。

我的问题是我有一个订单明细表,其中对于订单的每个项目,都有一个特定的类别(存储在另一个表中,但现在无关紧要)。

我必须根据这些类别的不同组合来检测特定的“组”订单: - A 组:商品类别为 13 + 15 + (66, 67, 68, 69) 中的任何一个的订单 商品类别为 77 + 78 + (66, 67, 68, 69, 71, 71) 中的任何一个的订单

到目前为止,我所做的是使用链接存在的 HUGE 查询来查找满足该条件的订单,但这是一场性能噩梦。

我希望有更好的方法来做到这一点,因为我的表有数百万条记录...

非常感谢!!!

【问题讨论】:

您的查询范围很广,我不清楚请更新您的问题并添加适当的数据示例.. 预期结果和您的代码示例.. 【参考方案1】:

我会使用group byhaving

select order_id
from order_details od
group by order_id
having sum(case when category = 13 then 1 else 0 end) > 0 and  -- at least one 13
       sum(case when category = 15 then 1 else 0 end) > 0 and  -- at least one 15
       sum(case when category in (66, 67, 68, 69) then 1 else 0 end) > 0  -- at least one of these

这很容易扩展。所以对于第二组:

having (sum(case when category = 13 then 1 else 0 end) > 0 and  -- at least one 13
        sum(case when category = 15 then 1 else 0 end) > 0 and  -- at least one 15
        sum(case when category in (66, 67, 68, 69) then 1 else 0 end) > 0    
       ) or
       (sum(case when category = 77 then 1 else 0 end) > 0 and  -- at least one 13
        sum(case when category = 78 then 1 else 0 end) > 0 and  -- at least one 15
        sum(case when category in (66, 67, 68, 69, 71, 71) then 1 else 0 end) > 0    
       ) 

【讨论】:

我做了一个快速测试,它看起来就像一个魅力,简单而且非常快!非常感谢您的帮助和创造性的解决方案!【参考方案2】:

目前尚不清楚您的数据库的结构,但您可以尝试类似的方法:

SELECT DISTINCT
       orders.order_id AS group_a_order
FROM   orders
JOIN   order_details od13
  ON   orders.order_id = od13.order_id
 AND   od13.category = 13
JOIN   order_details od15
  ON   orders.order_id = od15.order_id
 AND   od15.category = 15
JOIN   order_details od6x
  ON   orders.order_id = od6x.order_id
 AND   od6x.category IN (66, 67, 68, 69)

这将返回所有具有: - 至少 1 个第 13 类的详细信息 - 至少 1 个第 16 类的详细信息 - 至少 1 个类别 66、67、68 或 69 的详细信息

【讨论】:

这可能需要更长的时间才能运行。真正的 JOIN 将扫描整个表以查找所有可能的匹配项; WHERE EXISTS 扫描直到找到第一个匹配项,然后评估为 TRUE 并继续前进。最初的方法可能已经是最有效的方法,即使它看起来需要很长时间才能运行。 感谢您的回答。正如@t***side 指出的那样,我使用存在来避免全表扫描,因此使用 JOIN 可能不是一个好的选择。 如前所述,我不知道表格的结构,但我想您在 order_details.order_id (应该是 FK)上有一个索引。在这种情况下,没有全表扫描,而是索引扫描

以上是关于SQL Server - Exists 的替代方案(子查询太多)的主要内容,如果未能解决你的问题,请参考以下文章

SQL Server 中 MIN/MAX 的更快替代方案

用于 SQL Server 的 insert ignore into 的替代方案

在 SQL Server 中联合所有的替代方案

sql server 2008 中 percentile_cont 的替代方案

SQL Server Reporting Services 的轻松本地化替代方案?

您会考虑使用MS SQL Server Management Studio的替代方案吗? [关闭]