SQL选择具有最大和最小日期的行

Posted

技术标签:

【中文标题】SQL选择具有最大和最小日期的行【英文标题】:SQL Select rows with max and min date 【发布时间】:2011-11-01 13:16:31 【问题描述】:

我试图一次从一张表中获取 2 行。上周的最短日期时间(今天 - 7)和最新的(今天)。 我的桌子:

|id  |dataIn |dataOut|date                   |MachineId                            |
-----+-------+-------+-----------------------+-------------------------------------+
|1   |5006   |58     |2011-10-25 09:03:17.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559  
|2   |1200   |130    |2011-10-26 12:45:43.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559 
        ...  
|124 |1350   |480    |2011-10-29 13:29:04.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559  
|125 |8005   |560    |2011-10-31 21:18:35.000|7B788EE88E-6527-4CB4-AA4D-01B7F4048559  

我可以选择上周的数据:

SELECT 
dbo.myDatabase.Date AS [date], dbo.myDatabase.dataIn AS [in], 
dbo.myDatabase.dataOut AS [out] 
FROM 
dbo.myDatabase WHERE 
Date >=dateadd(day,datediff(day,0,GetDate())- 7,0) 
AND 
dbo.myDatabase.MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559' 

但我只想要第 1 行和第 125 行,因为这些行用于我的计算。 所以我的问题是: 如何从上一个查询的结果中选择 2 行(具有 MIN 和 MAX 日期)?

【问题讨论】:

最小或最大日期可能不止一行。那你想做什么? 日期/时间戳是否与明显的自动增量 ID 列直接相关??? @TimRogers 否。每台机器在有变化时插入一行带有日期时间的行,因此它是唯一的/机器 @DRapp 没有相关性。我只是想做的是获得一周的总 IN 和总 Out,这是过去 7 天内第一行和最后一行的 dataIn/dataOut 之间的差异。 【参考方案1】:

你可以用这个:

select * from dbo.myDatabase 
where 
    ([Date] = (select max([Date]) from /* your query */ ) or 
    [Date] = (select min([Date]) from /* your query */ ))
    and MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559' -- or any other id

编辑:由于两台机器完全有可能具有相同的date 值,因此应更新查询以在where 子句中也包含MachineId 过滤器。我更新了查询以显示这一点。

【讨论】:

请参阅我的回答中的说明......您的查询完全依赖于 Date 是否相等将起作用,但也会返回与给定日期匹配的任何内容的多条记录 - 即使在不同的机器上发送数据。 @DRapp 我明白你关于返回与日期匹配的所有内容的观点,即使是不同的MachineId。我更新了我的答案来解决这个问题。 如果你有组,你会怎么做 - 这意味着每个组都有一个 max(date) ...【参考方案2】:

如果您有多个具有相同日期的行,此查询将确保只返回一行作为最小值/最大值(仅适用于 Sql 2005+)。

;WITH dates 
     AS (SELECT dbo.Mydatabase(id)                    AS id, 
                dbo.mydatabase.DATE                   AS [date], 
                dbo.mydatabase.datain                 AS [in], 
                dbo.mydatabase.dataout                AS [out], 
                Row_number() OVER (ORDER BY DATE ASC) AS row 
         FROM   dbo.mydatabase 
         WHERE  DATE >= Dateadd(DAY, Datediff(DAY, 0, Getdate()) - 7, 0) 
                AND dbo.mydatabase.machineid = 
                    '7B788EE88E-6527-4CB4-AA4D-01B7F4048559'), 
     dates2 
     AS (SELECT id, 
                DATE, 
                in, 
                OUT, 
                row, 
                MIN(row) OVER (PARTITION BY (SELECT NULL)) AS lowest_row, 
                MAX(row) OVER (PARTITION BY (SELECT NULL)) AS highest_row 
         FROM   dates) 
SELECT id, 
       DATE, 
       in, 
       OUT 
FROM   dates2 
WHERE  row = lowest_row 
        OR row = highest_row 

【讨论】:

+1 但您可能会在 Row_number 中添加另一个字段(例如ORDER BY DATE ASC , dbo.Mydatabase(id) ASC),以使决胜局更具确定性。 如果窗口聚合函数应用于整个行集,您可以简单地省略PARTITION BY 子句(例如:MIN (row) OVER () AS lowest_row)。 @Andriy M - 通过省略 PARTITION BY (SELECT NULL) 是否有可能提高性能?就我个人而言,我发现使用它更具可读性,但那可能只是我! @Davin:很难说,部分原因是我以前可能从未遇到过PARTITION BY (SELECT NULL)。不过,我不希望有任何区别。【参考方案3】:

从读取 cmets 和每台机器执行自己的 INSERT 开始,插入不会插入自动增量列的值,因为该值由引擎处理。因此,除非机器正在更改其日期/时间,否则自动增量 ID 与每台机器的日期/时间直接相关。所以,就是说,我创建的样本获得了每个机器的最小和最大 ID,其中日期/时间是合格的,将导致相关范围的确定的第一个和最后一个 ID。然后就可以得到具体的ID记录了。

所以,如果您有 3 台机器,并且它们同时执行插入操作,那么它们各自的 ID 会以不同的方式生成...

|id  |date                   |MachineId                            |
-----+-------+-------+-----------------
|1   |2011-10-25 09:03:17.000| A
|2   |2011-10-25 09:03:17.000| B
|3   |2011-10-25 09:03:17.000| C

|4   |2011-10-26 12:45:43.000| B
|5   |2011-10-26 12:45:43.000| A
|6   |2011-10-26 12:45:43.000| C

        ...  

|124 |2011-10-29 13:29:04.000| C
|125 |2011-10-29 13:29:04.000| A
|126 |2011-10-29 13:29:04.000| B

|127 |2011-10-31 21:18:35.000| C
|128 |2011-10-31 21:18:35.000| B
|129 |2011-10-31 21:18:35.000| A

The first and last IDs per respective machine would become
Machine First ID   Last ID
A         1         129
B         2         128
C         3         127

内部预查询执行一次(根据特定机器),因此您将获得与每个机器日期/时间段的第一个/最后一个实例关联的 ID。然后在 ID 匹配上使用 OR 将其连接回表中以获取实际数据。

select 
      D2.*
   FROM
      ( SELECT 
              min( D1.ID ) MinDateID,
              max( D1.ID ) MaxDateID
           from
              dbo.myDatabase D1
           where
                  D1.MachineId = '7B788EE88E-6527-4CB4-AA4D-01B7F4048559' 
              AND D1.Date >=dateadd(day,datediff(day,0,GetDate())- 7,0)
      ) PreQuery
      JOIN dbo.MyDatabase D2
         on PreQuery.MinDateID = D2.ID
         OR PreQuery.MaxDateID = D2.ID

【讨论】:

根据 OP 对该问题的评论,IDs 与最小和最大日期无关。但是,只需稍作更改即可选择最小和最大日期。 @user798612,请参阅每个示例数据上下文的答案中的说明

以上是关于SQL选择具有最大和最小日期的行的主要内容,如果未能解决你的问题,请参考以下文章

选择具有最大值的行,并结合WHERE。 MAX和CAST,在spark.sql中

删除/隐藏 UIDatePicker 最小/最大日期范围之外的行?

Android 1.5 中 onDateChanged() 中具有最大和最小日期的日期选择器?

Oracle SQL 查询为包含相同 ID 的行提取最大日期的数据

从表中选择具有最大日期的行

如何选择具有最大值的行的所有列