SQL选择具有最大和最小日期的行
Posted
技术标签:
【中文标题】SQL选择具有最大和最小日期的行【英文标题】:SQL Select rows with max and min date 【发布时间】:2011-11-01 13:16:31 【问题描述】:我试图一次从一张表中获取 2 行。上周的最短日期时间(今天 - 7)和最新的(今天)。 我的桌子:
|id |dataIn |dataOut|date |MachineId |
-----+-------+-------+-----------------------+-------------------------------------+
|1 |5006 |58 |2011-10-25 09:03:17.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559
|2 |1200 |130 |2011-10-26 12:45:43.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559
...
|124 |1350 |480 |2011-10-29 13:29:04.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559
|125 |8005 |560 |2011-10-31 21:18:35.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559
我可以选择上周的数据:
SELECT
dbo.myDatabase.Date AS [date], dbo.myDatabase.dataIn AS [in],
dbo.myDatabase.dataOut AS [out]
FROM
dbo.myDatabase WHERE
Date >=dateadd(day,datediff(day,0,GetDate())- 7,0)
AND
dbo.myDatabase.MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559'
但我只想要第 1 行和第 125 行,因为这些行用于我的计算。 所以我的问题是: 如何从上一个查询的结果中选择 2 行(具有 MIN 和 MAX 日期)?
【问题讨论】:
最小或最大日期可能不止一行。那你想做什么? 日期/时间戳是否与明显的自动增量 ID 列直接相关??? @TimRogers 否。每台机器在有变化时插入一行带有日期时间的行,因此它是唯一的/机器 @DRapp 没有相关性。我只是想做的是获得一周的总 IN 和总 Out,这是过去 7 天内第一行和最后一行的 dataIn/dataOut 之间的差异。 【参考方案1】:你可以用这个:
select * from dbo.myDatabase
where
([Date] = (select max([Date]) from /* your query */ ) or
[Date] = (select min([Date]) from /* your query */ ))
and MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559' -- or any other id
编辑:由于两台机器完全有可能具有相同的date
值,因此应更新查询以在where
子句中也包含MachineId
过滤器。我更新了查询以显示这一点。
【讨论】:
请参阅我的回答中的说明......您的查询完全依赖于 Date 是否相等将起作用,但也会返回与给定日期匹配的任何内容的多条记录 - 即使在不同的机器上发送数据。 @DRapp 我明白你关于返回与日期匹配的所有内容的观点,即使是不同的MachineId
。我更新了我的答案来解决这个问题。
如果你有组,你会怎么做 - 这意味着每个组都有一个 max(date) ...【参考方案2】:
如果您有多个具有相同日期的行,此查询将确保只返回一行作为最小值/最大值(仅适用于 Sql 2005+)。
;WITH dates
AS (SELECT dbo.Mydatabase(id) AS id,
dbo.mydatabase.DATE AS [date],
dbo.mydatabase.datain AS [in],
dbo.mydatabase.dataout AS [out],
Row_number() OVER (ORDER BY DATE ASC) AS row
FROM dbo.mydatabase
WHERE DATE >= Dateadd(DAY, Datediff(DAY, 0, Getdate()) - 7, 0)
AND dbo.mydatabase.machineid =
'7B788EE88E-6527-4CB4-AA4D-01B7F4048559'),
dates2
AS (SELECT id,
DATE,
in,
OUT,
row,
MIN(row) OVER (PARTITION BY (SELECT NULL)) AS lowest_row,
MAX(row) OVER (PARTITION BY (SELECT NULL)) AS highest_row
FROM dates)
SELECT id,
DATE,
in,
OUT
FROM dates2
WHERE row = lowest_row
OR row = highest_row
【讨论】:
+1 但您可能会在 Row_number 中添加另一个字段(例如ORDER BY DATE ASC , dbo.Mydatabase(id) ASC
),以使决胜局更具确定性。
如果窗口聚合函数应用于整个行集,您可以简单地省略PARTITION BY
子句(例如:MIN (row) OVER () AS lowest_row
)。
@Andriy M - 通过省略 PARTITION BY (SELECT NULL) 是否有可能提高性能?就我个人而言,我发现使用它更具可读性,但那可能只是我!
@Davin:很难说,部分原因是我以前可能从未遇到过PARTITION BY (SELECT NULL)
。不过,我不希望有任何区别。【参考方案3】:
从读取 cmets 和每台机器执行自己的 INSERT 开始,插入不会插入自动增量列的值,因为该值由引擎处理。因此,除非机器正在更改其日期/时间,否则自动增量 ID 与每台机器的日期/时间直接相关。所以,就是说,我创建的样本获得了每个机器的最小和最大 ID,其中日期/时间是合格的,将导致相关范围的确定的第一个和最后一个 ID。然后就可以得到具体的ID记录了。
所以,如果您有 3 台机器,并且它们同时执行插入操作,那么它们各自的 ID 会以不同的方式生成...
|id |date |MachineId |
-----+-------+-------+-----------------
|1 |2011-10-25 09:03:17.000| A
|2 |2011-10-25 09:03:17.000| B
|3 |2011-10-25 09:03:17.000| C
|4 |2011-10-26 12:45:43.000| B
|5 |2011-10-26 12:45:43.000| A
|6 |2011-10-26 12:45:43.000| C
...
|124 |2011-10-29 13:29:04.000| C
|125 |2011-10-29 13:29:04.000| A
|126 |2011-10-29 13:29:04.000| B
|127 |2011-10-31 21:18:35.000| C
|128 |2011-10-31 21:18:35.000| B
|129 |2011-10-31 21:18:35.000| A
The first and last IDs per respective machine would become
Machine First ID Last ID
A 1 129
B 2 128
C 3 127
内部预查询执行一次(根据特定机器),因此您将获得与每个机器日期/时间段的第一个/最后一个实例关联的 ID。然后在 ID 匹配上使用 OR 将其连接回表中以获取实际数据。
select
D2.*
FROM
( SELECT
min( D1.ID ) MinDateID,
max( D1.ID ) MaxDateID
from
dbo.myDatabase D1
where
D1.MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559'
AND D1.Date >=dateadd(day,datediff(day,0,GetDate())- 7,0)
) PreQuery
JOIN dbo.MyDatabase D2
on PreQuery.MinDateID = D2.ID
OR PreQuery.MaxDateID = D2.ID
【讨论】:
根据 OP 对该问题的评论,ID
s 与最小和最大日期无关。但是,只需稍作更改即可选择最小和最大日期。
@user798612,请参阅每个示例数据上下文的答案中的说明以上是关于SQL选择具有最大和最小日期的行的主要内容,如果未能解决你的问题,请参考以下文章
选择具有最大值的行,并结合WHERE。 MAX和CAST,在spark.sql中
删除/隐藏 UIDatePicker 最小/最大日期范围之外的行?
Android 1.5 中 onDateChanged() 中具有最大和最小日期的日期选择器?