如何计算日期时间范围内的 n 个平均值?

Posted

技术标签:

【中文标题】如何计算日期时间范围内的 n 个平均值?【英文标题】:How do I calculate n averages over a datetime range? 【发布时间】:2013-08-27 17:39:58 【问题描述】:

我有一个应用程序,它每 15 秒从几个(现在是 48 个)不同的数据点采样数据。这些数据点在表中由两个不同的外键(MeasurementTypeId 和 GeneratorId)、一个样本值 (Value) 和一个日期时间 (MeasurementDate) 表示。

所以,表格看起来像这样(我只包括 10 行和几个不同的外键组合)

+------+-------------------+-------------+-------+------------------------+
|  ID  | MeasurementTypeId | GeneratorId | Value | MeasurementDate        |
+------+-------------------+-------------+-------+------------------------+
|    1 |       PSI         |     SG-52   |  0.19 |   2013-08-27 09:19:30  |
|    2 |       PH          |     SG-52   |  6.39 |   2013-08-27 09:19:30  |
|    3 |       DEG         |     SG-52   | 90.85 |   2013-08-27 09:19:30  |
|    4 |       PSI         |     PT-14   |  0.33 |   2013-08-27 09:19:30  |
|    5 |       PH          |     PT-14   |  6.41 |   2013-08-27 09:19:30  |
|    6 |       DEG         |     PT-14   | 89.20 |   2013-08-27 09:19:30  |
|    7 |       PSI         |     SG-52   |  0.20 |   2013-08-27 09:19:45  |
|    8 |       PH          |     SG-52   |  6.37 |   2013-08-27 09:19:45  |
|    9 |       DEG         |     SG-52   | 90.84 |   2013-08-27 09:19:45  |
|   10 |       PSI         |     PT-14   |  0.34 |   2013-08-27 09:19:45  |
+------+-------------------+-------------+-------+------------------------+

我希望创建一个存储过程,该过程可以返回日期时间范围内间隔的平均值(按外键分组)。但是,我不想定义间隔,而是将其留给调用存储过程的用户。

我希望存储过程接受参数

@numberOfIntervals int,
@startDateRange datetime,
@endDateRange datetime

然后将 startDateRange 和 endDateRange 的 datediff 除以 numberOfIntervals 以确定进行平均的间隔。

例如,如果使用 3 调用过程,'2013-08-26 00:00:00', '2013-08-27 00:00:00'

结果将是每组 3 条记录,其值等于 8 小时间隔的平均值(为简洁起见,仅包括 10 个结果...实际结果将包括 18 个)

+-------------------+-------------+-------+------------------------+
| MeasurementTypeId | GeneratorId | Value | MeasurementDate        |
+-------------------+-------------+-------+------------------------+
|       PSI         |     SG-52   |  0.20 |   2013-08-26 08:00:00  |
|       PH          |     SG-52   |  7.11 |   2013-08-26 08:00:00  |
|       DEG         |     SG-52   | 90.02 |   2013-08-26 08:00:00  |
|       PSI         |     PT-14   |  0.44 |   2013-08-26 08:00:00  |
|       PH          |     PT-14   |  6.98 |   2013-08-26 08:00:00  |
|       DEG         |     PT-14   | 90.31 |   2013-08-26 08:00:00  |
|       PSI         |     SG-52   |  0.21 |   2013-08-26 16:00:00  |
|       PH          |     SG-52   |  7.12 |   2013-08-26 16:00:00  |
|       DEG         |     SG-52   | 90.01 |   2013-08-26 16:00:00  |
|       PSI         |     PT-14   |  0.44 |   2013-08-26 16:00:00  |
+-------------------+-------------+-------+------------------------+

我已经完成了一些计算移动平均线的工作,但这是针对特定时间范围和特定间隔数的。有了这个,我希望用户能够选择一个日期范围和指定数量的间隔并绘制结果。

【问题讨论】:

【参考方案1】:

您可以创建一个 CTE 来获取要分组的间隔

DECLARE @numberOfIntervals INT = 3
DECLARE @startDateRange DATETIME = '2013-08-27'
DECLARE @endDateRange DATETIME = '2013-08-28'

--

DECLARE @range INT = DATEDIFF(HH, @startDateRange, @endDateRange) / @numberOfIntervals

;WITH calendar AS
(
  SELECT @startDateRange StartDate, DATEADD(HH, @range, @startDateRange) EndDate
  UNION ALL
  SELECT DATEADD(HH, @range, StartDate), DATEADD(HH, @range, EndDate)
  FROM calendar
  WHERE DATEADD(HH, @range, StartDate) < @endDateRange
)

SELECT MeasurementTypeId, 
       GeneratorId, 
       StartDate AS MeasurementDateStart,
       AVG(Value) AverageValue
FROM (
    SELECT d.*, c.StartDate
    FROM data d
    JOIN calendar c
      ON d.MeasurementDate >= c.StartDate
     AND d.MeasurementDate < c.EndDate
) sub
GROUP BY MeasurementTypeId, GeneratorId, StartDate

demo

您可能想要添加的是处理不能很好划分的 @numberOfIntervals,如果 @numberOfIntervals 大于 24 等,则添加分钟而不是小时。

【讨论】:

完美。我将其修改为超出分钟 (mi),并添加了一个按 MeasurementTypeId、GeneratorId、StartDate 的订单,只是为了更清楚地查看结果。三个多小时的 30,000 行样本运行良好。有没有办法让它更有效率?速度将是一个关键因素。

以上是关于如何计算日期时间范围内的 n 个平均值?的主要内容,如果未能解决你的问题,请参考以下文章

如何计算窗口内的平均值,其中窗口的范围取决于列的值?

在熊猫中生成给定范围内的随机日期

计算4年范围内的出现次数

如何计算每个月或一个月范围内的活动日期

根据日期范围计算滚动平均值[重复]

根据日期范围计算运行平均值