sql server中Select count(*)和Count(1)的区别和执行方式

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了sql server中Select count(*)和Count(1)的区别和执行方式相关的知识,希望对你有一定的参考价值。

参考技术A

   
在SQL
Server中Count(*)或者Count(1)或者Count([列])或许是最常用的聚合函数。很多人其实对这三者之间是区分不清的。本文会阐述这三者的作用,关系以及背后的原理。
   
往常我经常会看到一些所谓的优化建议不使用Count(*
)而是使用Count(1),从而可以提升性能,给出的理由是Count(
*)会带来全表扫描。而实际上如何写Count并没有区别。
   
Count(1)和Count(*)实际上的意思是,评估Count()中的表达式是否为NULL,如果为NULL则不计数,而非NULL则会计数。比如我们看代码1所示,在Count中指定NULL(优化器不允许显式指定NULL,因此需要赋值给变量才能指定)。
DECLARE
@xx
INT
SET
@xx=NULL
SELECT
COUNT(@xx)
FROM
[AdventureWorks2012].[Sales].[SalesOrderHeader]
代码清单1.Count中指定NULL
 
    
由于所有行都为NULL,则结果全不计数为0,结果如图1所示。
图1.显而易见,结果为0
 
   
因此当你指定Count(*)
或者Count(1)或者无论Count(‘anything\')时结果都会一样,因为这些值都不为NULL,如图2所示。
图2.只要在Count中指定非NULL表达式,结果没有任何区别
 那Count列呢?
   
对于Count(列)来说,同样适用于上面规则,评估列中每一行的值是否为NULL,如果为NULL则不计数,不为NULL则计数。因此Count(列)会计算列或这列的组合不为空的计数。
 
那Count(*)具体如何执行?
   
前面提到Count(
)有不为NULL的值时,在SQL
Server中只需要找出具体表中不为NULL的行数即可,也就是所有行(如果一行值全为NULL则该行相当于不存在)。那么最简单的执行办法是找一列NOT
NULL的列,如果该列有索引,则使用该索引,当然,为了性能,SQL
Server会选择最窄的索引以减少IO。
   
我们在Adventureworks2012示例数据库的[Person].[Address]表上删除所有的非聚集索引,在ModifyDate这个数据类型为DateTime的列上建立索引,我们看执行计划,如图3所示:
图3.使用了CreateDate的索引
 
   
我们继续在StateProvinceID列上建立索引,该列为INT列,占4字节,相比之前8字节
DateTime类型的列更短,因此SQL
Server选择了StateProvinceID索引。如图4所示。
图4.选择了更短的StateProvinceID索引
 
   
因此,如果某个表上Count(*)用的比较多时,考虑在一个最短的列建立一个单列索引,会极大的提升性能。

Sql Server 2005 COUNT 视图耗时太长

【中文标题】Sql Server 2005 COUNT 视图耗时太长【英文标题】:Sql Server 2005 COUNT on view takes too long 【发布时间】:2011-01-12 09:10:45 【问题描述】:

我的网站中有一个新闻通讯的分页列表,我使用这个视图来加载它。

这是视图(未选择列列表):

SELECT * FROM dbo.NewsletterHistory INNER JOIN dbo.Newsletter ON dbo.NewsletterHistory.NewsletterId = dbo.Newsletter.NewsletterId INNER JOIN dbo.sysNewsletterHistoryState ON dbo.NewsletterHistory.sysNewsletterHistoryStateId = dbo.sysNewsletterHistoryState.sysNewsletterHistoryStateId LEFT JOIN dbo.Client ON dbo.NewsletterHistory.AboutUserId = dbo.Client.ParentUserId

当我尝试执行计数查询以显示分页列表时出现问题。

在 NewsletterHistory 表中,我有大约 700.000 行。

select count(*) from dbo.NewsletterHistoryView newsletter0_ where newsletter0_.DeliveryMethod 11

这个计数查询大约需要 33 秒来执行。

我不能只将这么多的记录存储在某个地方,因为分页列表可以被过滤。

关于如何解决这个问题的任何想法?

【问题讨论】:

你有哪些索引? 你有没有关于连接和 wheres 列的索引? 你有没有想过使用索引? 我只在 sysNewsletterHistoryStateId 上有索引。我已经创建了一个包含所有列的索引,并且计数会立即执行。谢谢! 【参考方案1】:

使用以下列在 NewsletterHistory 表上创建索引

NewsletterId
sysNewsletterHistoryStateId
AboutUserId

我不知道你的数据,所以尝试三列的不同顺序以找到最快的一列。如果还不够快,请给我更多信息。

【讨论】:

【参考方案2】:

您可以使用 Count(PrimaryID),而不是使用 Count(*)。

【讨论】:

这不太可能带来任何好处。 SQL Server 在 2000 年的时间范围内克服了 * 的低效率问题。【参考方案3】:

显示执行计划并添加缺失的索引。

【讨论】:

【参考方案4】:

一个丑陋的解决方案....将您的结果放入临时表中进行计数...但我会使用索引...

使用 SQl Server 管理工作室 -> 工具 -> 数据库引擎优化顾问...将所有使用该表的脚本放在那里,让它告诉您构建的最佳索引是什么。它有助于手动完成...通过跟踪和错误

【讨论】:

以上是关于sql server中Select count(*)和Count(1)的区别和执行方式的主要内容,如果未能解决你的问题,请参考以下文章

SQL Server Temp Table to a Select Distinct Count Distinct quetsion [关闭]

Sql Server 2005 COUNT 视图耗时太长

Oracle Select into 用Sql server替换

怎样将sqlserver2005数据库中一张表的一半数据取出来

oracle,sql server count函数 存储过程 判断 行数 注意事项

sql server 2000 sp_executeSql问题