如何在 SQL Server 中生成日期范围

Posted

技术标签:

【中文标题】如何在 SQL Server 中生成日期范围【英文标题】:How to generate a range of dates in SQL Server 【发布时间】:2012-06-21 15:25:57 【问题描述】:

标题没有完全表达我的意思,这可能是重复的。

这是长版本:给定客人的姓名、注册日期和结帐日期,我如何为他们作为客人的每一天生成一行?

例如:Bob 于 7/14 入住并于 7/17 离开。我想要

('Bob', 7/14), ('Bob', 7/15), ('Bob', 7/16), ('Bob', 7/17) 

作为我的结果。

谢谢!

【问题讨论】:

看看这里***.com/questions/1478951/… [1]:***.com/questions/1478951/… 一般情况下,您不会。你有一个查找表并从中挑选出来。 WHERE calendar.date >= user.start_date AND calendar.date <= user.leave_date可以使用循环或递归查询生成集合,但它们永远不会像使用查找表那样快。 我问了一个非常相似的问题,但我的问题是几个小时,而不是几天。你可以很容易地改变以适应你的需要。 ***.com/questions/10986344/… 请指定 SQL Server 的版本。我发布了一个依赖于 SQL Server 2008 的解决方案;如果您使用的是 SQL Server 2005,它可能会有所不同。 @Dems 这是一个很好的答案。我希望发现 SQL 中有一种语言结构可以很容易地生成范围。 【参考方案1】:

我认为,对于这个特定目的,以下查询与使用专用查找表一样有效。

DECLARE @start DATE, @end DATE;
SELECT @start = '20110714', @end = '20110717';

;WITH n AS 
(
  SELECT TOP (DATEDIFF(DAY, @start, @end) + 1) 
    n = ROW_NUMBER() OVER (ORDER BY [object_id])
  FROM sys.all_objects
)
SELECT 'Bob', DATEADD(DAY, n-1, @start)
FROM n;

结果:

Bob     2011-07-14
Bob     2011-07-15
Bob     2011-07-16
Bob     2011-07-17

大概你需要这个作为一个集合,而不是单个成员,所以这里有一种方法来适应这种技术:

DECLARE @t TABLE
(
    Member NVARCHAR(32), 
    RegistrationDate DATE, 
    CheckoutDate DATE
);

INSERT @t SELECT N'Bob', '20110714', '20110717'
UNION ALL SELECT N'Sam', '20110712', '20110715'
UNION ALL SELECT N'Jim', '20110716', '20110719';

;WITH [range](d,s) AS 
(
  SELECT DATEDIFF(DAY, MIN(RegistrationDate), MAX(CheckoutDate))+1,
    MIN(RegistrationDate)
    FROM @t -- WHERE ?
),
n(d) AS
(
  SELECT DATEADD(DAY, n-1, (SELECT MIN(s) FROM [range]))
  FROM (SELECT ROW_NUMBER() OVER (ORDER BY [object_id])
  FROM sys.all_objects) AS s(n)
  WHERE n <= (SELECT MAX(d) FROM [range])
)
SELECT t.Member, n.d
FROM n CROSS JOIN @t AS t
WHERE n.d BETWEEN t.RegistrationDate AND t.CheckoutDate;
----------^^^^^^^ not many cases where I'd advocate between!

结果:

Member    d
--------  ----------
Bob       2011-07-14
Bob       2011-07-15
Bob       2011-07-16
Bob       2011-07-17
Sam       2011-07-12
Sam       2011-07-13
Sam       2011-07-14
Sam       2011-07-15
Jim       2011-07-16
Jim       2011-07-17
Jim       2011-07-18
Jim       2011-07-19

正如@Dems 指出的,这可以简化为:

;WITH natural AS 
(
  SELECT ROW_NUMBER() OVER (ORDER BY [object_id]) - 1 AS val 
  FROM sys.all_objects
) 
SELECT t.Member, d = DATEADD(DAY, natural.val, t.RegistrationDate) 
  FROM @t AS t INNER JOIN natural 
  ON natural.val <= DATEDIFF(DAY, t.RegistrationDate, t.CheckoutDate);

【讨论】:

AFAIK SQL Server 的优化器意味着您实际上并不需要WHERE n &lt; = (SELECT MAX()),这意味着这可以进一步简化...WITH natural AS (SELECT ROW_NUMBER() OVER (ORDER BY id) - 1 AS val FROM sys.objects) SELECT t.Member, DATEADD(DAY, natural.val, t.start) FROM @t AS t INNER JOIN natural ON natural.val &lt;= DATEDIFF(DAY, t.start, t.end) [但是,即使那样,直接查找表至少仍将使用更少的 CPU 周期。] @Dems 在我开始写作时,我的目标是使用TOP 中的最高范围来对抗sys.all_objects。你是对的,它可以被简化。 谢谢,您的查询完全符合我的要求。一个问题——是否有必要在“范围”表上使用 MAX 和 MIN ?在此示例中,我只看到为“范围”生成的一行,因此只有一个最大或最小候选(在这种情况下,我只需将范围和开始日期放在常规变量中)。你的 SQL 印章给我留下了深刻的印象,我很好奇我是否遗漏了一些微妙之处。 这适用于您与多个用户打交道并且可能存在重叠日期的情况。如果您只处理一个用户的单次访问,​​那么您根本不需要使用该版本的查询。 嗯。我们的生产盒,有成千上万的客人和重叠的日期,仍然只返回 [range] 的一行。【参考方案2】:

我通常通过在某个表上使用 row_number() 来实现这一点。所以:

select t.name, dateadd(d, seq.seqnum, t.start_date)
from t left outer join
     (select row_number() over (order by (select NULL)) as seqnum
      from t
     ) seq
     on seqnum <= datediff(d, t.start_date, t.end_date)

seq 的计算非常快,因为不需要计算或排序。但是,您需要确保表对于所有时间跨度都足够大。

【讨论】:

【参考方案3】:

如果你有一个“Tally”或“Numbers”表,这样的事情就会变得非常简单。

 SELECT Member, DatePresent = DATEADD(dd,t.N,RegistrationDate)
   FROM @t 
  CROSS JOIN dbo.Tally t
  WHERE t.N BETWEEN 0 AND DATEDIFF(dd,RegistrationDate,CheckoutDate)
;

以下是构建“Tally”表的方法。

--===================================================================
--      Create a Tally table from 0 to 11000
--===================================================================
--===== Create and populate the Tally table on the fly.
 SELECT TOP 11001
        IDENTITY(INT,0,1) AS N
   INTO dbo.Tally
   FROM Master.sys.ALL_Columns ac1
  CROSS JOIN Master.sys.ALL_Columns ac2
;
--===== Add a CLUSTERED Primary Key to maximize performance
  ALTER TABLE dbo.Tally
    ADD CONSTRAINT PK_Tally_N 
        PRIMARY KEY CLUSTERED (N) WITH FILLFACTOR = 100
;
--===== Allow the general public to use it
  GRANT SELECT ON dbo.Tally TO PUBLIC
;
GO

有关什么是 SQL 中的“Tally”表以及如何使用它来替换 While 循环和重要的递归 CTE 的“隐藏 RBAR”的更多信息,请参阅以下文章。

http://www.sqlservercentral.com/articles/T-SQL/62867/

【讨论】:

我真的很喜欢这个概念。如果有一个像这样的内置虚拟表可以加入(不会浪费内存或磁盘 IO),那就太好了。如果您曾在 SQL Server feedback forms 上建议虚拟 Tally 表功能,请将链接发送给我,我会投票! 显然有人已经这样做了:https://feedback.azure.com/forums/908035-sql-server/suggestions/32890519-add-a-built-in-table-of-numbers【参考方案4】:

这可能对你有用:

with mycte as
 (
     select cast('2000-01-01' as datetime) DateValue, 'Bob' as Name
     union all
     select DateValue + 1 ,'Bob' as Name
     from    mycte   
     where   DateValue + 1 < '2000-12-31'
 )
 select *
from    mycte
OPTION (MAXRECURSION 0)

【讨论】:

包含“计数递归 CTE”。请参阅以下文章,了解为什么即使在计算少量数字时它们也如此糟糕。 sqlservercentral.com/articles/T-SQL/74118【参考方案5】:

我会创建一个触发器来创建额外的记录并在结帐时运行它。或者,您可以让每天午夜的工作做同样的事情(如果您需要数据库中的最新信息)。

【讨论】:

这不是一个真正的答案 - 触发器如何“创建额外记录”? @AaronBertrand 这是任何语言的简单编程任务。 如果它是如此微不足道,OP 就不会问了,对吧?用 this 语言的一些代码来支持你的答案应该不难? 我想我们对“我如何为他们是客人的每一天生成一行”的解释不同。 对我来说,这听起来像是一个关于特定语法的问题,而不是“去写一个查询”。 @Andy... 你写了“@AaronBertrand 这是任何语言的微不足道的编程任务”。让我们看看你有什么。发布触发代码。

以上是关于如何在 SQL Server 中生成日期范围的主要内容,如果未能解决你的问题,请参考以下文章

如何在 sql server 中生成随机 nvarchars

在熊猫中生成给定范围内的随机日期

如何在 sql server 2008 中生成随机布尔值?

在python中生成给定范围内的所有日期

如何在 SQL Server 中生成唯一递增的整数值?

如何使用存储过程在 SQL Server 中生成表的数据脚本文件?