从表中的“最后”N 行获取平均值

Posted

技术标签:

【中文标题】从表中的“最后”N 行获取平均值【英文标题】:Get average value from the "last" N rows in a table 【发布时间】:2013-12-30 10:30:52 【问题描述】:

在我的 Postgres 数据库表中,我可以按日期顺序找到 cap_cs137 的最后 20 个条目:

select cap_cs137 FROM capintec ORDER BY cap_date DESC LIMIT 20;

我也可以取平均值:

select avg(cap_cs137) FROM capintec LIMIT 20;

但是,如何结合上述语句来获得按日期顺序排列的最后 20 个条目的平均值?

我们有一个过时的 RHEL 5.8 服务器,它支持 Postgres 8.1.23,因此不允许使用 WITH 查询。

【问题讨论】:

【参考方案1】:

您可以使用 CTE:

WITH s AS
    (SELECT cap_cs137 FROM capintec ORDER BY cap_date DESC LIMIT 20)
SELECT avg(cap_cs137) FROM s;

第一个查询被缓存为临时表“s”,然后我们在最终查询中对其运行聚合。

编辑:

原来 OP 不能使用 CTE,因为他使用的是旧版本的 Postgres,所以最终的答案是一个子选择(我碰巧不喜欢 CTE,纯粹是为了可读性;但确实在这种情况下也是一样的):

SELECT avg(cap_cs137) FROM
   (SELECT cap_cs137 FROM capintec ORDER BY cap_date DESC LIMIT 20);

【讨论】:

感谢您的解决方案。不幸的是,我们的服务器已经过时并且使用 postgresql 8.1.23,我无法使用 WITH 命令 然后,gurka 建议的内部选择应该可以工作。 IIRC 有一些关于在 CTE 之外的子查询上运行聚合的有趣规则(或者它是否对子查询中的聚合运行查询?),所以 YMMV:SELECT avg(cap_cs137) FROM (SELECT cap_cs137 FROM capintec ORDER BY cap_date DESC LIMIT 20); CTE 在任何情况下都没有用。只需使用子选择。 @PirateApp 假设表上有一个属性“组”,使用WHERE 将子查询限制为给定组。例如,要平均来自some_table"Super Friends"'stuff 的最新20 个条目:SELECT avg(stuff) FROM (SELECT stuff FROM some_table WHERE group = "Super Friends" ORDER BY date DESC LIMIT 20); @PirateApp 在这种情况下,您将得到混合在一起的结果。但是,如果您要将此查询设为对所有组的新表中的每一行执行的子查询,则可以进行 3 阶段查询,返回所有组的 Group, RunningAverage 列表。【参考方案2】:

只需使用内部选择:

SELECT AVG(cap_cs137)
FROM (SELECT cap_cs137 FROM capintec ORDER BY cap_date DESC LIMIT 20) AS sub;

【讨论】:

以上是关于从表中的“最后”N 行获取平均值的主要内容,如果未能解决你的问题,请参考以下文章

从表中选择前 N 行

从表中删除所有数据,但最后 N 个条目

使用最后 n 个值的平均值或中值填充数据框不同列中的缺失值

如何使用 sql 中的每 n 行(例如第 24、48 和 72 行)计算移动平均值?

TSQL 从表中选择最后 10 行?

如何从 sql 中的 2 个表中按组聚合和计算平均值?