如何在 SQL Server 中生成日期范围
Posted
技术标签:
【中文标题】如何在 SQL Server 中生成日期范围【英文标题】:How to generate a range of dates in SQL Server 【发布时间】:2012-06-21 15:25:57 【问题描述】:标题没有完全表达我的意思,这可能是重复的。
这是长版本:给定客人的姓名、注册日期和结帐日期,我如何为他们作为客人的每一天生成一行?
例如:Bob 于 7/14 入住并于 7/17 离开。我想要
('Bob', 7/14), ('Bob', 7/15), ('Bob', 7/16), ('Bob', 7/17)
作为我的结果。
谢谢!
【问题讨论】:
看看这里***.com/questions/1478951/… [1]:***.com/questions/1478951/… 一般情况下,您不会。你有一个查找表并从中挑选出来。WHERE calendar.date >= user.start_date AND calendar.date <= user.leave_date
您可以使用循环或递归查询生成集合,但它们永远不会像使用查找表那样快。
我问了一个非常相似的问题,但我的问题是几个小时,而不是几天。你可以很容易地改变以适应你的需要。 ***.com/questions/10986344/…
请指定 SQL Server 的版本。我发布了一个依赖于 SQL Server 2008 的解决方案;如果您使用的是 SQL Server 2005,它可能会有所不同。
@Dems 这是一个很好的答案。我希望发现 SQL 中有一种语言结构可以很容易地生成范围。
【参考方案1】:
我认为,对于这个特定目的,以下查询与使用专用查找表一样有效。
DECLARE @start DATE, @end DATE;
SELECT @start = '20110714', @end = '20110717';
;WITH n AS
(
SELECT TOP (DATEDIFF(DAY, @start, @end) + 1)
n = ROW_NUMBER() OVER (ORDER BY [object_id])
FROM sys.all_objects
)
SELECT 'Bob', DATEADD(DAY, n-1, @start)
FROM n;
结果:
Bob 2011-07-14
Bob 2011-07-15
Bob 2011-07-16
Bob 2011-07-17
大概你需要这个作为一个集合,而不是单个成员,所以这里有一种方法来适应这种技术:
DECLARE @t TABLE
(
Member NVARCHAR(32),
RegistrationDate DATE,
CheckoutDate DATE
);
INSERT @t SELECT N'Bob', '20110714', '20110717'
UNION ALL SELECT N'Sam', '20110712', '20110715'
UNION ALL SELECT N'Jim', '20110716', '20110719';
;WITH [range](d,s) AS
(
SELECT DATEDIFF(DAY, MIN(RegistrationDate), MAX(CheckoutDate))+1,
MIN(RegistrationDate)
FROM @t -- WHERE ?
),
n(d) AS
(
SELECT DATEADD(DAY, n-1, (SELECT MIN(s) FROM [range]))
FROM (SELECT ROW_NUMBER() OVER (ORDER BY [object_id])
FROM sys.all_objects) AS s(n)
WHERE n <= (SELECT MAX(d) FROM [range])
)
SELECT t.Member, n.d
FROM n CROSS JOIN @t AS t
WHERE n.d BETWEEN t.RegistrationDate AND t.CheckoutDate;
----------^^^^^^^ not many cases where I'd advocate between!
结果:
Member d
-------- ----------
Bob 2011-07-14
Bob 2011-07-15
Bob 2011-07-16
Bob 2011-07-17
Sam 2011-07-12
Sam 2011-07-13
Sam 2011-07-14
Sam 2011-07-15
Jim 2011-07-16
Jim 2011-07-17
Jim 2011-07-18
Jim 2011-07-19
正如@Dems 指出的,这可以简化为:
;WITH natural AS
(
SELECT ROW_NUMBER() OVER (ORDER BY [object_id]) - 1 AS val
FROM sys.all_objects
)
SELECT t.Member, d = DATEADD(DAY, natural.val, t.RegistrationDate)
FROM @t AS t INNER JOIN natural
ON natural.val <= DATEDIFF(DAY, t.RegistrationDate, t.CheckoutDate);
【讨论】:
AFAIK SQL Server 的优化器意味着您实际上并不需要WHERE n < = (SELECT MAX())
,这意味着这可以进一步简化...WITH natural AS (SELECT ROW_NUMBER() OVER (ORDER BY id) - 1 AS val FROM sys.objects) SELECT t.Member, DATEADD(DAY, natural.val, t.start) FROM @t AS t INNER JOIN natural ON natural.val <= DATEDIFF(DAY, t.start, t.end)
[但是,即使那样,直接查找表至少仍将使用更少的 CPU 周期。]
@Dems 在我开始写作时,我的目标是使用TOP
中的最高范围来对抗sys.all_objects
。你是对的,它可以被简化。
谢谢,您的查询完全符合我的要求。一个问题——是否有必要在“范围”表上使用 MAX 和 MIN ?在此示例中,我只看到为“范围”生成的一行,因此只有一个最大或最小候选(在这种情况下,我只需将范围和开始日期放在常规变量中)。你的 SQL 印章给我留下了深刻的印象,我很好奇我是否遗漏了一些微妙之处。
这适用于您与多个用户打交道并且可能存在重叠日期的情况。如果您只处理一个用户的单次访问,那么您根本不需要使用该版本的查询。
嗯。我们的生产盒,有成千上万的客人和重叠的日期,仍然只返回 [range] 的一行。【参考方案2】:
我通常通过在某个表上使用 row_number() 来实现这一点。所以:
select t.name, dateadd(d, seq.seqnum, t.start_date)
from t left outer join
(select row_number() over (order by (select NULL)) as seqnum
from t
) seq
on seqnum <= datediff(d, t.start_date, t.end_date)
seq 的计算非常快,因为不需要计算或排序。但是,您需要确保表对于所有时间跨度都足够大。
【讨论】:
【参考方案3】:如果你有一个“Tally”或“Numbers”表,这样的事情就会变得非常简单。
SELECT Member, DatePresent = DATEADD(dd,t.N,RegistrationDate)
FROM @t
CROSS JOIN dbo.Tally t
WHERE t.N BETWEEN 0 AND DATEDIFF(dd,RegistrationDate,CheckoutDate)
;
以下是构建“Tally”表的方法。
--===================================================================
-- Create a Tally table from 0 to 11000
--===================================================================
--===== Create and populate the Tally table on the fly.
SELECT TOP 11001
IDENTITY(INT,0,1) AS N
INTO dbo.Tally
FROM Master.sys.ALL_Columns ac1
CROSS JOIN Master.sys.ALL_Columns ac2
;
--===== Add a CLUSTERED Primary Key to maximize performance
ALTER TABLE dbo.Tally
ADD CONSTRAINT PK_Tally_N
PRIMARY KEY CLUSTERED (N) WITH FILLFACTOR = 100
;
--===== Allow the general public to use it
GRANT SELECT ON dbo.Tally TO PUBLIC
;
GO
有关什么是 SQL 中的“Tally”表以及如何使用它来替换 While 循环和重要的递归 CTE 的“隐藏 RBAR”的更多信息,请参阅以下文章。
http://www.sqlservercentral.com/articles/T-SQL/62867/
【讨论】:
我真的很喜欢这个概念。如果有一个像这样的内置虚拟表可以加入(不会浪费内存或磁盘 IO),那就太好了。如果您曾在 SQL Server feedback forms 上建议虚拟 Tally 表功能,请将链接发送给我,我会投票! 显然有人已经这样做了:https://feedback.azure.com/forums/908035-sql-server/suggestions/32890519-add-a-built-in-table-of-numbers【参考方案4】:这可能对你有用:
with mycte as
(
select cast('2000-01-01' as datetime) DateValue, 'Bob' as Name
union all
select DateValue + 1 ,'Bob' as Name
from mycte
where DateValue + 1 < '2000-12-31'
)
select *
from mycte
OPTION (MAXRECURSION 0)
【讨论】:
包含“计数递归 CTE”。请参阅以下文章,了解为什么即使在计算少量数字时它们也如此糟糕。 sqlservercentral.com/articles/T-SQL/74118【参考方案5】:我会创建一个触发器来创建额外的记录并在结帐时运行它。或者,您可以让每天午夜的工作做同样的事情(如果您需要数据库中的最新信息)。
【讨论】:
这不是一个真正的答案 - 触发器如何“创建额外记录”? @AaronBertrand 这是任何语言的简单编程任务。 如果它是如此微不足道,OP 就不会问了,对吧?用 this 语言的一些代码来支持你的答案应该不难? 我想我们对“我如何为他们是客人的每一天生成一行”的解释不同。以上是关于如何在 SQL Server 中生成日期范围的主要内容,如果未能解决你的问题,请参考以下文章