SQL 查询计算两个附加列
Posted
技术标签:
【中文标题】SQL 查询计算两个附加列【英文标题】:SQL Query calculating two additional columns 【发布时间】:2020-09-01 19:47:38 【问题描述】:我有一个表格,每天都会填充数据库大小。我需要修改可以计算每日增长和每周增长的查询。
select * from sys.dbsize
where SNAP_TIME > sysdate -3
order by SNAP_TIME
电流输出
我想添加两个额外的列 每日增长 (DB_SIZE sysdate - DB_SIZE (sysdate -1)) 每周增长 (DB_SIZE sysdate - DB_SIZE (sysdate -7))
在为这两个附加列构建 SQL 时需要一些帮助。任何帮助将不胜感激。
谢谢,
【问题讨论】:
【参考方案1】:一种选择是使用LAG
分析函数来计算每日增长和相关子查询(在SELECT
语句中)每周增长。
例如:
SQL> with dbsize (snap_time, db_size) as
2 (select sysdate - 8, 100 from dual union all
3 select sysdate - 7, 110 from dual union all
4 select sysdate - 6, 105 from dual union all
5 select sysdate - 5, 120 from dual union all
6 select sysdate - 4, 130 from dual union all
7 select sysdate - 3, 130 from dual union all
8 select sysdate - 2, 142 from dual union all
9 select sysdate - 1, 144 from dual union all
10 select sysdate - 0, 150 from dual
11 )
12 select
13 a.snap_time,
14 a.db_size,
15 a.db_size - lag(a.db_size) over (order by a.snap_time) daily_growth,
16 --
17 db_size - (select db_size from dbsize b
18 where trunc(b.snap_time) = trunc(a.snap_time) - 7
19 ) weekly_growth
20 from dbsize a
21 order by a.snap_time;
SNAP_TIME DB_SIZE DAILY_GROWTH WEEKLY_GROWTH
------------------- ---------- ------------ -------------
24.08.2020 21:52:20 100
25.08.2020 21:52:20 110 10
26.08.2020 21:52:20 105 -5
27.08.2020 21:52:20 120 15
28.08.2020 21:52:20 130 10
29.08.2020 21:52:20 130 0
30.08.2020 21:52:20 142 12
31.08.2020 21:52:20 144 2 44
01.09.2020 21:52:20 150 6 40
9 rows selected.
SQL>
【讨论】:
您好,如何用实际值更新您提供的 db_size 的虚拟值? 第 1 - 11 行是样本数据;你的桌子上已经有了。您可能需要的查询从第 12 行开始。【参考方案2】:我会为这两列推荐lag()
:
select s.*,
(dbsize - dbsize_1) as daily_growth,
(dbsize - dbsize_7) as weekly_growth
from (select s.*,
lag(dbsize) over (order by snap_time) as dbsize_1,
lag(dbsize, 7) over (order by snap_time) as dbsize_7
from sys.dbsize
) s
where SNAP_TIME > sysdate -3
order by SNAP_TIME;
如果你没有每天的快照,你可以用窗框来处理:
select s.*,
(dbsize - dbsize_1) as daily_growth,
(dbsize - dbsize_7) as weekly_growth
from (select s.*,
max(dbsize) over (order by trunc(snap_time) range between interval '1' day preceding and interval '1' second preceding) as dbsize_1,
lag(dbsize, 7) over (order by trunc(snap_time) range between '7' day preceding and interval '6 1' day to hour) as dbsize_7
from sys.dbsize
) s
where SNAP_TIME > sysdate - 3
order by SNAP_TIME;
【讨论】:
【参考方案3】:如果每天总是有一条记录,你可以使用lag()
:
select
snap_time
db_size,
db_size - lag(db_size, 1) over(order by snap_time) daily_growth,
db_size - lag(db_size, 7) over(order by snap_time) weekly_growth
from sys.db.size
order by snap_time
这实际上看起来向后 1 行和向后 7 行。如果缺少日期,或者每天有多条记录,那么您可以按天平均快照大小,并在窗口函数中使用窗口范围:
select
trunc(snap_time) snap_day,
avg(db_size) avg_db_size,
avg(db_size) - avg(db_size) over(
order by trunc(snap_time)
range between interval '1' day preceding and interval '1' day preceding
) daily_growth,
avg(db_size) - avg(db_size) over(
order by trunc(snap_time)
range between interval '7' day preceding and interval '7' day preceding
) weekly_growth
from sys.db.size
group by trunc(snap_time)
order by trunc(snap_time)
如果您只想要最近 3 天的结果,您可以将上述两个查询中的任何一个变成子查询,并在外部查询中进行过滤:
select *
from ( ... ) t
where snap_time > sysdate - 3 -- or: snap_day > trunc(sysdate) - 3
【讨论】:
以上是关于SQL 查询计算两个附加列的主要内容,如果未能解决你的问题,请参考以下文章
SQL Server-聚焦计算列或计算列持久化查询性能(二十二)
1、sql查询语句时怎么把几个字段拼接成一个字段?这几个字段是整型的。
如何在房间数据库dao中附加两个或多个子查询,而这些子查询存储在变量中