使用带有data.table的滚动功能

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用带有data.table的滚动功能相关的知识,希望对你有一定的参考价值。

我在使用roll专门应用data.table包中的函数时遇到了问题。我正在尝试为每个组DT$obs计算DT$group列的滚动指标。我可以使用zoo包计算滚动指标,但我想在roll包函数中使用一些额外的参数。

演示错误如下。

require(data.table)
require(zoo)
require(roll)


# Fabricated Data:
DT <- data.table(group = rep(c("A", "B"), each = 20), obs = runif(40, min = 0, max = 100))


# Calculate a rolling sum (this is working properly)
DT[, RollingSum := lapply(.SD, function(x) zoo::rollsumr(x, k = 5, fill = NA)), by = "group", .SDcols = "obs"]


# Attempt to calculate a rolling z-score (this throws me an error)
DT[, RollingZScore := lapply(.SD, function(x) roll::roll_scale(as.matrix(x), width = 10, min_obs = 5)), by = "group", .SDcols = "obs"]

enter image description here

我无法弄清楚zoo函数和roll函数有什么不同。它们各自返回数字向量。任何指导赞赏。

答案

正如@Frank所描述的那样,问题是roll_scale(因此lapply输出的每个元素)的结果是一个矩阵。您可以使用sapply而不是lapply,或者将as.vector放在函数定义中。

DT[, RollingZScore := sapply(.SD, 
                             function(x) roll::roll_scale(as.matrix(x), width = 10, min_obs = 5)), 
   by = "group", .SDcols = "obs"]

要么

DT[, RollingZScore := lapply(.SD, 
                              function(x) as.vector(roll::roll_scale(as.matrix(x), width = 10, min_obs = 5))), 
    by = "group", .SDcols = "obs"]
另一答案

这可以通过rollapplyr完成,只需定义一个函数,如果输入的元素少于5个,则返回NA

Scale <- function(x) if (length(x) < 5) NA else tail(scale(x), 1)
DT[, rollingScore := rollapplyr(obs, 10, Scale, partial = TRUE), by = "group"]

以上是关于使用带有data.table的滚动功能的主要内容,如果未能解决你的问题,请参考以下文章

使用 data.table 包滚动平均值到 R 中的多个变量

带有 TabLayout 的片段内的 ScrollView 不滚动,为啥?

减少滚动产品data.table

使用带有渲染功能的 Vue.js 3 片段

在data.table R中滚动连接

R data.table 滑动窗口