SQL 查询计算两个附加列

Posted

技术标签:

【中文标题】SQL 查询计算两个附加列【英文标题】:SQL Query calculating two additional columns 【发布时间】:2020-09-01 19:47:38 【问题描述】:

我有一个表格,每天都会填充数据库大小。我需要修改可以计算每日增长和每周增长的查询。

select * from sys.dbsize 
where SNAP_TIME > sysdate -3
order by SNAP_TIME

电流输出

我想添加两个额外的列 每日增长 (DB_SIZE sysdate - DB_SIZE (sysdate -1)) 每周增长 (DB_SIZE sysdate - DB_SIZE (sysdate -7))

在为这两个附加列构建 SQL 时需要一些帮助。任何帮助将不胜感激。

谢谢,

【问题讨论】:

【参考方案1】:

一种选择是使用LAG 分析函数来计算每日增长和相关子查询(在SELECT 语句中)每周增长。

例如:

SQL> with dbsize (snap_time, db_size) as
  2    (select sysdate - 8, 100 from dual union all
  3     select sysdate - 7, 110 from dual union all
  4     select sysdate - 6, 105 from dual union all
  5     select sysdate - 5, 120 from dual union all
  6     select sysdate - 4, 130 from dual union all
  7     select sysdate - 3, 130 from dual union all
  8     select sysdate - 2, 142 from dual union all
  9     select sysdate - 1, 144 from dual union all
 10     select sysdate - 0, 150 from dual
 11    )
 12  select
 13    a.snap_time,
 14    a.db_size,
 15    a.db_size - lag(a.db_size) over (order by a.snap_time) daily_growth,
 16    --
 17    db_size - (select db_size from dbsize b
 18               where trunc(b.snap_time) = trunc(a.snap_time) - 7
 19              ) weekly_growth
 20  from dbsize a
 21  order by a.snap_time;

SNAP_TIME              DB_SIZE DAILY_GROWTH WEEKLY_GROWTH
------------------- ---------- ------------ -------------
24.08.2020 21:52:20        100
25.08.2020 21:52:20        110           10
26.08.2020 21:52:20        105           -5
27.08.2020 21:52:20        120           15
28.08.2020 21:52:20        130           10
29.08.2020 21:52:20        130            0
30.08.2020 21:52:20        142           12
31.08.2020 21:52:20        144            2            44
01.09.2020 21:52:20        150            6            40

9 rows selected.

SQL>

【讨论】:

您好,如何用实际值更新您提供的 db_size 的虚拟值? 第 1 - 11 行是样本数据;你的桌子上已经有了。您可能需要的查询从第 12 行开始。【参考方案2】:

我会为这两列推荐lag()

select s.*,
       (dbsize - dbsize_1) as daily_growth,
       (dbsize - dbsize_7) as weekly_growth
from (select s.*,
             lag(dbsize) over (order by snap_time) as dbsize_1,
             lag(dbsize, 7) over (order by snap_time) as dbsize_7
      from sys.dbsize 
     ) s
where SNAP_TIME > sysdate -3
order by SNAP_TIME;

如果你没有每天的快照,你可以用窗框来处理:

select s.*,
       (dbsize - dbsize_1) as daily_growth,
       (dbsize - dbsize_7) as weekly_growth
from (select s.*,
             max(dbsize) over (order by trunc(snap_time) range between interval '1' day preceding and interval '1' second preceding) as dbsize_1,
             lag(dbsize, 7) over (order by trunc(snap_time) range between '7' day preceding and interval '6 1' day to hour) as dbsize_7
      from sys.dbsize 
     ) s
where SNAP_TIME > sysdate - 3
order by SNAP_TIME;

【讨论】:

【参考方案3】:

如果每天总是有一条记录,你可以使用lag()

select 
    snap_time
    db_size,
    db_size - lag(db_size, 1) over(order by snap_time) daily_growth,
    db_size - lag(db_size, 7) over(order by snap_time) weekly_growth
from sys.db.size
order by snap_time

这实际上看起来向后 1 行和向后 7 行。如果缺少日期,或者每天有多条记录,那么您可以按天平均快照大小,并在窗口函数中使用窗口范围:

select 
    trunc(snap_time) snap_day,
    avg(db_size) avg_db_size,
    avg(db_size) - avg(db_size) over(
        order by trunc(snap_time)
        range between interval '1' day preceding and interval '1' day preceding
    ) daily_growth,
    avg(db_size) - avg(db_size) over(
        order by trunc(snap_time)
        range between interval '7' day preceding and interval '7' day preceding
    ) weekly_growth
from sys.db.size
group by trunc(snap_time)
order by trunc(snap_time)

如果您只想要最近 3 天的结果,您可以将上述两个查询中的任何一个变成子查询,并在外部查询中进行过滤:

select *
from ( ... ) t
where snap_time > sysdate - 3 -- or: snap_day > trunc(sysdate) - 3

【讨论】:

以上是关于SQL 查询计算两个附加列的主要内容,如果未能解决你的问题,请参考以下文章

SQL Server-聚焦计算列或计算列持久化查询性能(二十二)

1、sql查询语句时怎么把几个字段拼接成一个字段?这几个字段是整型的。

DAX语言(PowerBI)度量值和新建列的区别

如何在房间数据库dao中附加两个或多个子查询,而这些子查询存储在变量中

在 ORACLE SQL 中组合两个 SQL 查询以给出两个列

SQL 查询两个 PIVOT 列组合