SQL Server - 跨行汇总日期范围,同时保留间隙
Posted
技术标签:
【中文标题】SQL Server - 跨行汇总日期范围,同时保留间隙【英文标题】:SQL Server - Summarize date ranges across rows while preserving gaps 【发布时间】:2020-10-07 10:50:03 【问题描述】:我想知道这是否可能,但我认为我的措辞可能是我很难找到它的原因。
这是我的场景。
看到下面的选择结果了吗?
| Column A | Column B | Column C |
| 001 | 09-10-20 | 09-11-20 |
| 001 | 09-11-20 | 09-16-20 |
| 001 | 09-16-20 | 10-20-20 |
| 001 | 10-20-20 | 11-11-20 |
| 001 | 11-12-20 | 11-13-20 |
| 001 | 11-14-20 | 11-16-20 |
| 001 | 11-16-20 | 11-20-20 |
| 001 | 11-20-20 | 11-21-20 |
有没有办法让它输出为 v ?
| Column A | Column B | Column C |
| 001 | 09-10-20 | 11-11-20 |
| 001 | 11-12-20 | 11-13-20 |
| 001 | 11-14-20 | 11-21-20 |
老实说,到目前为止,我认为仅使用 SQL 似乎不太可能,但我想我还是会问它。
我已经看过并且确实看到了识别差距和识别重叠的方法,但我仍然无法理解如何仅使用 SQL 来完成这项工作。
通常我只需要在 SQL 之外使用另一段代码筛选输出,然后从表 A 中给我表 B。但这需要额外的开销,我宁愿只学习如何在 SQL 中执行此操作。
【问题讨论】:
【参考方案1】:您可以使用lag()
和累积总和来定义组。然后聚合:
select a, min(b), max(c)
from (select t.*,
sum(case when prev_c >= c then 0 else 1 end) over (partition by a order by b) as grp
from (select t.*,
lag(c) over (partition by a order by b) as prev_c
from t
) t
) t
group by a, grp;
这个问题是间隙和孤岛问题的一个例子。使用lag()
和累积和来识别“岛屿”是解决这类问题的一种方法。
【讨论】:
谢谢!这不是 1:1,但这让我找到了我需要的确切解决方案。【参考方案2】:SNODGRASS 的经典方法是:
WITH T
AS (SELECT F.[Column B], L.[Column C], F.[Column A]
FROM T_INTERVAL_ITV AS F
JOIN T_INTERVAL_ITV AS L
ON F.[Column C] <= L.[Column C]
AND F.[Column A] = L.[Column A]
INNER JOIN T_INTERVAL_ITV AS E
ON F.[Column A] = E.[Column A]
GROUP BY F.[Column B], L.[Column C], F.[Column A]
HAVING COUNT(CASE
WHEN (E.[Column B] < F.[Column B] AND F.[Column B] <= E.[Column C])
OR (E.[Column B] <= L.[Column C] AND L.[Column C] < E.[Column C])
THEN 1
END) = 0)
SELECT [Column A], [Column B], MIN([Column C]) AS [Column C]
FROM T
GROUP BY [Column A], [Column B];
【讨论】:
以上是关于SQL Server - 跨行汇总日期范围,同时保留间隙的主要内容,如果未能解决你的问题,请参考以下文章