如何计算日期时间范围内的 n 个平均值?
Posted
技术标签:
【中文标题】如何计算日期时间范围内的 n 个平均值?【英文标题】:How do I calculate n averages over a datetime range? 【发布时间】:2013-08-27 17:39:58 【问题描述】:我有一个应用程序,它每 15 秒从几个(现在是 48 个)不同的数据点采样数据。这些数据点在表中由两个不同的外键(MeasurementTypeId 和 GeneratorId)、一个样本值 (Value) 和一个日期时间 (MeasurementDate) 表示。
所以,表格看起来像这样(我只包括 10 行和几个不同的外键组合)
+------+-------------------+-------------+-------+------------------------+
| ID | MeasurementTypeId | GeneratorId | Value | MeasurementDate |
+------+-------------------+-------------+-------+------------------------+
| 1 | PSI | SG-52 | 0.19 | 2013-08-27 09:19:30 |
| 2 | PH | SG-52 | 6.39 | 2013-08-27 09:19:30 |
| 3 | DEG | SG-52 | 90.85 | 2013-08-27 09:19:30 |
| 4 | PSI | PT-14 | 0.33 | 2013-08-27 09:19:30 |
| 5 | PH | PT-14 | 6.41 | 2013-08-27 09:19:30 |
| 6 | DEG | PT-14 | 89.20 | 2013-08-27 09:19:30 |
| 7 | PSI | SG-52 | 0.20 | 2013-08-27 09:19:45 |
| 8 | PH | SG-52 | 6.37 | 2013-08-27 09:19:45 |
| 9 | DEG | SG-52 | 90.84 | 2013-08-27 09:19:45 |
| 10 | PSI | PT-14 | 0.34 | 2013-08-27 09:19:45 |
+------+-------------------+-------------+-------+------------------------+
我希望创建一个存储过程,该过程可以返回日期时间范围内间隔的平均值(按外键分组)。但是,我不想定义间隔,而是将其留给调用存储过程的用户。
我希望存储过程接受参数
@numberOfIntervals int,
@startDateRange datetime,
@endDateRange datetime
然后将 startDateRange 和 endDateRange 的 datediff 除以 numberOfIntervals 以确定进行平均的间隔。
例如,如果使用 3 调用过程,'2013-08-26 00:00:00', '2013-08-27 00:00:00'
结果将是每组 3 条记录,其值等于 8 小时间隔的平均值(为简洁起见,仅包括 10 个结果...实际结果将包括 18 个)
+-------------------+-------------+-------+------------------------+
| MeasurementTypeId | GeneratorId | Value | MeasurementDate |
+-------------------+-------------+-------+------------------------+
| PSI | SG-52 | 0.20 | 2013-08-26 08:00:00 |
| PH | SG-52 | 7.11 | 2013-08-26 08:00:00 |
| DEG | SG-52 | 90.02 | 2013-08-26 08:00:00 |
| PSI | PT-14 | 0.44 | 2013-08-26 08:00:00 |
| PH | PT-14 | 6.98 | 2013-08-26 08:00:00 |
| DEG | PT-14 | 90.31 | 2013-08-26 08:00:00 |
| PSI | SG-52 | 0.21 | 2013-08-26 16:00:00 |
| PH | SG-52 | 7.12 | 2013-08-26 16:00:00 |
| DEG | SG-52 | 90.01 | 2013-08-26 16:00:00 |
| PSI | PT-14 | 0.44 | 2013-08-26 16:00:00 |
+-------------------+-------------+-------+------------------------+
我已经完成了一些计算移动平均线的工作,但这是针对特定时间范围和特定间隔数的。有了这个,我希望用户能够选择一个日期范围和指定数量的间隔并绘制结果。
【问题讨论】:
【参考方案1】:您可以创建一个 CTE 来获取要分组的间隔
DECLARE @numberOfIntervals INT = 3
DECLARE @startDateRange DATETIME = '2013-08-27'
DECLARE @endDateRange DATETIME = '2013-08-28'
--
DECLARE @range INT = DATEDIFF(HH, @startDateRange, @endDateRange) / @numberOfIntervals
;WITH calendar AS
(
SELECT @startDateRange StartDate, DATEADD(HH, @range, @startDateRange) EndDate
UNION ALL
SELECT DATEADD(HH, @range, StartDate), DATEADD(HH, @range, EndDate)
FROM calendar
WHERE DATEADD(HH, @range, StartDate) < @endDateRange
)
SELECT MeasurementTypeId,
GeneratorId,
StartDate AS MeasurementDateStart,
AVG(Value) AverageValue
FROM (
SELECT d.*, c.StartDate
FROM data d
JOIN calendar c
ON d.MeasurementDate >= c.StartDate
AND d.MeasurementDate < c.EndDate
) sub
GROUP BY MeasurementTypeId, GeneratorId, StartDate
demo
您可能想要添加的是处理不能很好划分的 @numberOfIntervals
,如果 @numberOfIntervals
大于 24 等,则添加分钟而不是小时。
【讨论】:
完美。我将其修改为超出分钟 (mi),并添加了一个按 MeasurementTypeId、GeneratorId、StartDate 的订单,只是为了更清楚地查看结果。三个多小时的 30,000 行样本运行良好。有没有办法让它更有效率?速度将是一个关键因素。以上是关于如何计算日期时间范围内的 n 个平均值?的主要内容,如果未能解决你的问题,请参考以下文章