性能调优11：查询统计

Posted 2022-07-18 ljhdo

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了性能调优11：查询统计相关的知识，希望对你有一定的参考价值。

数据库引擎的工作流程可以归纳为接收请求、执行请求和返回结果。数据库引擎每接收到一个新的查询请求（Query Request），查询优化器就会执行以下工作流程：编译请求，生成执行计划，并把执行计划缓存到内存中，执行计划，最后向客户端返回查询的结果。把执行计划存储到内存的目的是为了复用执行计划，减少编译查询请求的时间消耗和CPU消耗。当数据库引擎再次接收到相同的查询请求，数据库引擎不需直接跳过编译请求的过程，直接复用已经缓存的执行计划。

数据库引擎并不是把查询计划永久保存在内存中，而是会根据内存的压力，智能剔除一些创建时间早，并且复用频次少的执行计划。

一，语句句柄和计划句柄

数据库引擎要实现查询计划的复用，必须能够识别查询已经执行过，这就需要对查询语句进行标记；查询的执行计划也会被标记，这就需要用到两个唯一值：

sql_handle：用以唯一标识一段TSQL文本（Batch或SP），TSQL文本存储在SQL Manager Cache（SQLMGR）中。
plan_handle：用于唯一标识一个已编辑的查询计划，查询计划存储在计划缓存（Plan Cache）中。

sql_handle和plan_handle是如何生成的？

对于ad hoc查询，sql_handle是基于整体的SQL Text生成的哈希值；如果一个batch包含多个TSQL语句，那么多个TSQL语句作为一个整体，batch中的查询字句拥有相同的sql_handle值，但是有不同的偏移量。
对于执行的SP、触发器或函数等数据库对象，sql_handle是由database ID 和 object ID 派生的哈希值。
plan_handle是由整体（批处理或SP）生成的已编译计划派生的哈希值。

sql_handle和plan_handle 之间具有1对多的关系。一个sql_handle 能够生成多个查询计划，对应多个plan_handle，但是每个plan_handle只能对应一个sql_handle 。sql_handle对于每一个batch都是唯一的，但是，如果执行batch的条件发生改变，比如set 选项发生变化，那么数据库引擎在执行同样的batch时，会生成新的执行计划，产生新的plan_handle，但是sql_handle不变。想要了解更详细的信息，请阅读《2.0 Sql_Handle and Plan_Handle Explained》。

1，SQL句柄

sql_handle是一个token，用于唯一标记查询文本所属的batch或sp，把sql_handle传递给 sys.dm_exec_sql_text()动态管理函数，并结合偏移 statement_start_offset和statement_end_offset，可以抽取出单个查询的SQL文本。

函数 sys.dm_exec_sql_text(sql_handle | plan_handle)用于获得整个Batch的TSQL文本，由于TSQL文本都是以nvarchar(max)类型存储的，一个nvarchar是2个字节，因此，一般情况下，字节偏移量都是2的倍数。

2，计划句柄

plan_handle是一个token，是整个Execution Plan的哈希值，用于唯一标识一个batch或sp的执行计划，把plan_handle传递给sys.dm_exec_query_plan(plan_handle)动态管理函数，可以获取整体（batch或sp）的showplan。

3，查询计划（query plan）

查询计划是指查询语句的显示计划（showplan），动态管理视图 sys.dm_exec_query_plan 返回以XML格式表示的showplan，动态管理视图 sys.dm_exec_text_query_plan 返回以文本格式表示的showplan：

sys.dm_exec_query_plan(plan_handle)

sys.dm_exec_text_query_plan   
(   
    plan_handle   
    ,  statement_start_offset | 0 | DEFAULT   
    ,  statement_end_offset | -1 | DEFAULT   
)

文本方式可以指定batch中的单个TSQL语句，这需要指定该语句的偏移statement_start_offset 和 statement_end_offset。

二，抽取查询语句

动态管理视图 sys.dm_exec_query_stats 缓存的是单个查询语句的执行计划，而sql_handle指向的是整个Batch或SP的句柄值，因此，在该视图中，可能存在多个相同的sql_handle。

为了获得单个查询语句的文本，必须通过偏移量从整体（Batch语句）中抽取，偏移量的单位是字节，字节数量从0开始：

statement_start_offset：语句开始偏移的字节序号
statement_end_offset：语句结束偏移的字节序号，-1 表示TSQL文本的末尾

把sql_handle传递给 sys.dm_exec_sql_text()动态管理函数，并结合偏移 statement_start_offset和statement_end_offset，可以抽取出单个查询的SQL文本，抽取查询语句的脚本是：

select substring(st.text 
                ,qs.statement_start_offset/2+1,
                ( case when qs.statement_end_offset = -1 then len(convert(nvarchar(max), st.text))
                        else (qs.statement_end_offset - qs.statement_start_offset)/2
                    end 
                )
        ) as individual_query
        ,st.text as entire_query
from sys.dm_exec_query_stats qs
outer apply sys.dm_exec_sql_text(qs.sql_handle) as st

三，查询的统计数据

数据库引擎会把每一个查询请求的执行信息保存起来，例如，查询的文本，查询等待的时长，执行的时间，消耗的资源等，并对这些信息进行汇总和统计，这些汇总之后的数据就是查询统计，存储到内存结构 DMV：sys.dm_exec_query_stats中。在该视图中，每一行数据都表示一个查询语句的统计数据。

请求的执行信息都经过汇总之后，存储到DMV：sys.dm_exec_query_stats中，从该统计数据中，可以找出对性能影响最大的查询请求，由于该DMV存储的是累加值，在使用数据之前，一定要关注记录的开始时间：

creation_time：计划编译的时间
last_execution_time：最近一次计划开始执行的时间

这两个时间表示查询计划的第一次执行和最后一次执行的时间戳。

1，查看语句级别的统计数据

执行计划的重编译次数，执行查询的总时间，逻辑读和物理读的次数等计数器，是观察查询执行情况的重要指标：

plan_generation_num：表示执行计划产生的数量，表示同一个TSQL文本重新编译的次数；
execution_count：计划执行的次数
total_elapsed_time：单词elapsed是指单个语句执行的总时间，包括 waiting的时间或 CPU工作（worker）的时间，单位是微秒（us），一微秒是千分之一毫秒(ms)
total_worker_time：CPU工作的总时间，单位是微秒（us）
total_logical_reads：查询计划执行的逻辑读的总次数；
total_logical_writes：查询计划执行的逻辑写的总次数；
total_physical_reads：查询计划执行的物理读的总次数；
total_rows：查询返回的数据行的总数量
total_dop：并发执行的并发度的累加和
total_grant_kb：该查询计划收到的预留授予内存（reserved memory grant）的总量，单位是KB
total_used_grant_kb：该查询计划使用的预留授予内存（reserved memory grant）的总量，单位是KB
total_ideal_grant_kb：该查询计划预估的理想授予内存（ideal memory grant）的总量，单位是KB
total_splils：查询计划执行时，出现页溢出的总页数；

以下脚本用于查看执行计划在单个语句级别上的平均数据，并按照平均执行时间排序，获取 top 111 的数据：

select top 111 
    qs.execution_count,
    qs.total_rows/qs.execution_count as avg_rows,
    qs.total_worker_time/qs.execution_count/1000 as avg_worker_ms,
    qs.total_elapsed_time/qs.execution_count/1000 as avg_elapsed_ms,
    qs.total_physical_reads/qs.execution_count as avg_physical_reads,
    qs.total_logical_reads/qs.execution_count as avg_logical_reads,
    qs.total_logical_writes/qs.execution_count as avg_logical_writes,
    qs.creation_time,
    qs.plan_generation_num,
    --st.text as entire_query,
    substring(st.text,
            qs.statement_start_offset/2 + 1,      
            ( case when qs.statement_end_offset = -1 
                        then len(convert(nvarchar(max), st.text))
                else (qs.statement_end_offset -qs.statement_start_offset)/2
              end)
            ) as individual_query
from sys.dm_exec_query_stats qs 
cross apply sys.dm_exec_sql_text(qs.sql_handle) as st 
order by avg_elapsed_ms desc

2，查看存储过程级别的查询统计

对于缓存的存储过程，数据库引擎把SP相关的统计数据缓存在视图：sys.dm_exec_procedure_stats 中，每一行数据都表示一个SP的统计数据：

select top 111
    db_name(ps.database_id) as db_name
    ,ps.database_id
    ,object_schema_name(ps.object_id,ps.database_id)+‘.‘+object_name(ps.object_id,ps.database_id) as proc_name
    ,ps.type_desc as proc_type
    ,ps.cached_time
    ,ps.execution_count
    ,ps.total_worker_time/ps.execution_count/1000 as avg_worker_ms
    ,ps.total_elapsed_time/ps.execution_count/1000 as avg_elapsed_ms
    ,ps.total_physical_reads/ps.execution_count as avg_physical_reads
    ,ps.total_logical_reads/ps.execution_count as avg_logical_reads
    ,ps.total_logical_writes/ps.execution_count as avg_logical_writes
from sys.dm_exec_procedure_stats ps
where ps.database_id<32767
order by avg_elapsed_ms desc

对于database_id 为 32767，这个id是资源数据库（Resource Database）预留的ID，一般情况下，用户创建的数据库ID都会小于该数值。

四，显示被缓存的计划

函数 sys.dm_exec_query_plan 以XML格式返回指定batch或SP的查询计划，参数是plan_handle，这意味着，函数返回的是整个语句（Batch或SP）的showplan，XML格式是可视化的，也可以返回文本格式的showplan。

select top 111 
    qs.execution_count,
    qs.total_rows/qs.execution_count as avg_rows,
    qs.total_worker_time/qs.execution_count/1000 as avg_worker_ms,
    qs.total_elapsed_time/qs.execution_count/1000 as avg_elapsed_ms,
    qs.total_physical_reads/qs.execution_count as avg_physical_reads,
    qs.total_logical_reads/qs.execution_count as avg_logical_reads,
    qs.total_logical_writes/qs.execution_count as avg_logical_writes,
    qs.creation_time,
    qs.plan_generation_num,
    st.text as entire_query,
    substring(st.text,
            qs.statement_start_offset/2 + 1,      
            ( case when qs.statement_end_offset = -1 
                        then len(convert(nvarchar(max), st.text))
                else (qs.statement_end_offset -qs.statement_start_offset)/2
              end)
            ) as individual_query,
    qp.query_plan
from sys.dm_exec_query_stats qs 
cross apply sys.dm_exec_sql_text(qs.sql_handle) as st 
outer apply sys.dm_exec_query_plan(qs.plan_handle) as qp
order by avg_elapsed_ms desc

五，计划的统计信息

动态管理视图：sys.dm_exec_cached_plans 中，每一个行存储一个查询计划，通过该视图，可以查看已缓存的查询计划、查询文本、缓存计划占用的内存、缓存计划复用的次数等信息。

select cp.refcounts
    ,cp.usecounts
    ,cp.size_in_bytes
    ,cp.cacheobjtype
    ,cp.objtype
    ,st.text as batch_sql
    --,cp.plan_handle
from sys.dm_exec_cached_plans cp
outer apply sys.dm_exec_sql_text(cp.plan_handle) st

参考文档：

以上是关于性能调优11：查询统计的主要内容，如果未能解决你的问题，请参考以下文章