曲演杂坛--表变量的预估行数

Posted 笑东风

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了曲演杂坛--表变量的预估行数相关的知识,希望对你有一定的参考价值。

在讨论临时表和表变量的区别时,其中一个重点就是两者的预估行数,在默认设置下,表变量的预估行数总是为1,而临时表的预估行数会随表中数据量的变化而变化。正是因为这个区别,在处理大数据量时往往推荐使用临时表而非表变量(当然还有索引的问题)。

 科普下, 查询优化器会根据预估行数和操作运算符来预估资源消耗,根据资源消耗情况来选取相对“较优”的执行计划,如果预估行数与实际行数差距较大,则可能生成不高效的执行计划。

举个栗子,看着远处的小土包没多远,骑着马跑了半天发现还没到,这就是看山跑死马的典故,如果能相对“准确”地预估出距离,那么就不是骑马而是开飞机,这就是预估行数影响执行计划!

今天就表变量的预估行数问题来学习下。

测试1:首先看下默认设置下表变量的预估行数

DECLARE @TB1 TABLE
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO @TB1(C1)
SELECT object_id FROM sys.all_columns

SELECT COUNT(1) FROM @TB1 AS T1
INNER JOIN sys.objects AS T2
ON T1.C1 = T2.OBJECT_ID

通过上面的执行计划,很容易看到:临时表@TB1的实际行数为7490,而预估行数为1.

 

测试2:使用临时表

CREATE TABLE #TB1
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO #TB1(C1)
SELECT object_id FROM sys.all_columns

SELECT COUNT(1) FROM #TB1 AS T1
INNER JOIN sys.objects AS T2
ON T1.C1 = T2.OBJECT_ID

从执行计划来看,临时表的预估行数和实际行数相同,均为7490.

 

测试3:使用OPTION (RECOMPILE)查询提示

DECLARE @TB1 TABLE
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO @TB1(C1)
SELECT object_id FROM sys.all_columns

SELECT COUNT(1) FROM @TB1 AS T1
INNER JOIN sys.objects AS T2
ON T1.C1 = T2.OBJECT_ID
OPTION (RECOMPILE)

MSDN上对OPTION(RECOMPILE)的解释如下:

指示 SQL Server 数据库引擎在执行为查询生成的计划后将其丢弃,从而在下次执行同一查询时强制查询优化器重新编译查询计划。

在编译查询计划时,RECOMPILE 查询提示将使用查询中任意本地变量的当前值,如果查询位于存储过程中,这些当前值将传递给任意参数。

而在本测试中,使用OPTION(RECOMPILE)来使查询优化器对表变量有一个“准确”的预估行数,可以看到使用查询提示OPTION(RECOMPILE)下实际行数和预估行数均为7490。

PS: 通过测试1和测试3可以发现,随着预估行数的变化,执行计划也发生了变化。

 

测试4:使用跟踪标志2453

跟踪标志2453是SQL Server 2012 SP2和SQL Server CU3引入的,其作用于OPTION(RECOMPILE)类似,使得查询优化器在生成执行计划时对表变量有一个“准确”的预估行数,而不是简单粗暴地使用预估行数1。

DBCC TRACEON(2453)
DECLARE @TB1 TABLE
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO @TB1(C1)
SELECT object_id FROM sys.all_columns

SELECT COUNT(1) FROM @TB1 AS T1
INNER JOIN sys.objects AS T2
ON T1.C1 = T2.OBJECT_ID

DBCC TRACEOFF(2453)

可以看到,在开启跟踪标志后,即使未使用查询提示OPTION(RECOMPILE),表变量的预估行数和实际行数均为7490。

 

测试5,跟踪标志2453的适用场景

一些文章介绍称跟踪标志2453仅使用与JOIN操作中,而对于一些“简单”查询,跟踪标志2453没有效果

最简单的查询莫过于SELECT FROM,如:

DBCC TRACEON(2453)
DECLARE @TB1 TABLE
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO @TB1(C1)
SELECT object_id FROM sys.all_columns


SELECT COUNT(1) FROM @TB1


DBCC TRACEOFF(2453)

诚然,对于上面的查询,开启跟踪2453仍不能解决表变量预估行数为1的问题。

哪对于稍微复杂但又没有JOIN的查询呢?如:

DBCC TRACEON(2453)
DECLARE @TB1 TABLE
(
    ID BIGINT IDENTITY(1,1) PRIMARY KEY,
    C1 BIGINT
)

INSERT INTO @TB1(C1)
SELECT object_id FROM sys.all_columns


SELECT C1, COUNT(1) FROM @TB1 AS T1
GROUP BY C1

SELECT * FROM @TB1 AS T1
ORDER BY NEWID() DESC


DBCC TRACEOFF(2453)

可以发现,即使没有JOIN操作,开启跟踪2453会影响表变量的预估行数。

仔细分析下,对于简单的SELECT FROM操作,无表变量中数据量的数量多少,都只能进行聚集索引扫描,而对于后面两个查询,无论是GROUP BY还是ORDER BY,表变量中数据量不同,对数据进行排序所采用的算法会发生变化,因此推测:在开启跟踪2453条件下,如果表变量的数据量大小对最终生成的执行计划有影响,那么会对表变量返回一个“准确”的预估行数。

 

测试5,重编译问题

由于使用OPTION(RECOMPILE)会导致存储过程重编译,而频繁地重编译会大量消耗CPU资源,那么使用跟踪标志会导致重编译问题么?

本人未对该问题进行测试,从参考文章中了解到,跟踪标志不会导致存储过程频繁地发生重编译的问题,但如果随存储过程的传入参数不同,其内部使用的表变量的数据量存在严重变化的情况下,会引发存储过程重编译。打个碧玉,同样是出门,10公里内打车,50公里内打地铁,10000公里得打飞机,不同的距离导致不同的出行方式,不同的参数导致不同的执行计划。

虽然此跟踪标志没有引入频繁的重编译问题,同样也引入了新的问题,即不同参数需要使用不同执行计划,却因为没有重编译导致重用旧的执行计划引发性能问题。

查询提示OPTION(RECOMPILE)虽然导致每次都重编译,但却又能很好地防止“参数变化导致表变量的数据量发生变化最终生成不高效执行计划”的问题。

 

测试6,自定义表类型

既然表变量可以受影响于此跟踪标志,那么用户自定义的表类型呢?答案是自定义表类型同样可以受该跟踪标志的影响。

 

##==================================================##

总结:

由于跟踪标志2453的存在,使得我们可以在不修改任何代码的情况下,使查询获得类似于增加查询提示OPTION(RECOMPILE)的效果,同时还避免OPTION(RECOMPILE)带来的重复编译问题,而且跟踪标志可以在会话级别和实例级别进行设置,通过设置SQL Server的启动参数,可以轻松解决表变量的预估行数为1的问题,看似很美好,但是事物都有两面性,实例级别的跟踪标志需要进行严格的测试,同时需要验证不同参数对表变量的数据量的影响。

就个人而言,了解各种跟踪标志有利于我们进一步了解SQL Server本质,但在大多数情况下,我们要尽可能地避免使用跟踪标志,能用常规办法解决问题问题最好还是使用常规办法!

谁说的“能动手的话尽量别动嘴”!!!

##==================================================##

参考连接:

https://msdn.microsoft.com/zh-cn/library/ms181714.aspx

http://sqlperformance.com/2014/06/t-sql-queries/table-variable-perf-fix

##==================================================##

 

以上是关于曲演杂坛--表变量的预估行数的主要内容,如果未能解决你的问题,请参考以下文章

SQL Server中关于基数估计如何计算预估行数的一些探讨

各国央行筹备数字货币,2020年将迎来大爆发七哥杂坛2020-03-19

最强解析面试题:无环链表相交

SQL SERVER的统计信息

如何提取 Count(*) 中的行数,并发送到变量。 (PL/SQL)

Atitit 衡量项目的规模