将月度数据与季度数据合并?

Posted

技术标签:

【中文标题】将月度数据与季度数据合并?【英文标题】:Merging monthly level data with quarterly data? 【发布时间】:2020-11-23 09:59:31 【问题描述】:

我有 2 个数据集 - 一个是季度数据,我需要与月度数据相匹配。因此,季度数据中的值将在最终数据集中重复三次。我在下面创建了一个四分之一的样本,但这需要重复很多个季度。

month <- c(1/20, 2/20, 3/20)
rating <- c(0.5,0.6,0.65)
df1 <- cbind(month,rating)

quarter <- c(“q1/20”)
amount <- c(100)
df2 <- cbind(quarter,amount)

我的最终数据集应该具有以下结构


month <- c(1/20, 2/20, 3/20)
rating <- c(0.5,0.6,0.65)
quarter <- c(“q1/20”, “q1/20”, “q1/20”)
amount <- c(100,100,100)

df3 <- cbind(month, rating, quarter, amount)

在完整的季度数据集 (df1) 中,一些观测值也是月度观测值,因此可能会出现按月匹配月度观测值和按季度匹配季度观测值的情况?

感谢期待。

【问题讨论】:

什么是q1(信息缺失)? 抱歉,第 1/20 季度仅表明观察结果来自 2020 年第 1 季度。已编辑 - 希望这可以解决问题。 嗨奥利。在您的示例中,数据采用矩阵而不是数据框的形式。这是故意的吗? 嗨艾伦,不抱歉,它们应该是数据框。 【参考方案1】:

假设你有这些数据。

head(m.dat)
#   month rating
# 1  1/18   0.91
# 2  2/18   0.94
# 3  3/18   0.29
# 4  4/18   0.83
# 5  5/18   0.64
# 6  6/18   0.52

head(q.dat)
#   quarter amount
# 1   q1/18      1
# 2   q2/18     21
# 3   q3/18     91
# 4   q4/18     61
# 5   q1/19     38
# 6   q2/19     44

您可以使用分配矩阵qm 将月份信息与季度匹配。

qm <- matrix(c(1:12, paste0("q", rep(1:4, each=3))), 12, 2)
m.dat$quarter <- paste0(qm[match(qm[, 1], gsub("(^\\d*).*", "\\1", m.dat$month)), 2], 
                        "/",
                        sapply(strsplit(m.dat$month, "/"), `[`, 2))

这使您可以使用merge

res <- merge(m.dat, q.dat, all=TRUE)
head(res)
#   quarter month rating amount
# 1   q1/18  1/18   0.91      1
# 2   q1/18  2/18   0.94      1
# 3   q1/18  3/18   0.29      1
# 4   q1/19  1/19   0.93     38
# 5   q1/19  2/19   0.26     38
# 6   q1/19  3/19   0.46     38

玩具数据

m.dat <- structure(list(month = c("1/18", "2/18", "3/18", "4/18", "5/18", 
"6/18", "7/18", "8/18", "9/18", "10/18", "11/18", "12/18", "1/19", 
"2/19", "3/19", "4/19", "5/19", "6/19", "7/19", "8/19", "9/19", 
"10/19", "11/19", "12/19", "1/20", "2/20", "3/20", "4/20", "5/20", 
"6/20", "7/20", "8/20", "9/20", "10/20", "11/20", "12/20"), rating = c(0.91, 
0.94, 0.29, 0.83, 0.64, 0.52, 0.74, 0.13, 0.66, 0.71, 0.46, 0.72, 
0.93, 0.26, 0.46, 0.94, 0.98, 0.12, 0.47, 0.56, 0.9, 0.14, 0.99, 
0.95, 0.08, 0.51, 0.39, 0.91, 0.45, 0.84, 0.74, 0.81, 0.39, 0.69, 
0, 0.83)), class = "data.frame", row.names = c(NA, -36L))

q.dat <- structure(list(quarter = c("q1/18", "q2/18", "q3/18", "q4/18", 
"q1/19", "q2/19", "q3/19", "q4/19", "q1/20", "q2/20", "q3/20", 
"q4/20"), amount = c(1, 21, 91, 61, 38, 44, 4, 97, 43, 96, 89, 
64)), class = "data.frame", row.names = c(NA, -12L))

【讨论】:

【参考方案2】:

假设 df1 和 df2 是最后注释中显示的数据框,在每个中创建一个 yearqtr 类的 yq 列并在其上合并:

library(zoo)   

df1 <- transform(df1, yq = as.yearqtr(month, "%m/%y"))
df2 <- transform(df2, yq = as.yearqtr(quarter, "q%q/%y"))

merge(df1, df2, by = "yq", all = TRUE)

给予:

       yq month rating quarter amount
1 2020 Q1  1/20   0.50   q1/20    100
2 2020 Q1  2/20   0.60   q1/20    100
3 2020 Q1  3/20   0.65   q1/20    100

我们还可以考虑使用以下方法将月份列转换为 yearmon 类列 as.yearmon.

注意

df1 <- data.frame(month = c("1/20", "2/20", "3/20"), rating = c(0.5,0.6,0.65))
df2 <- data.frame(quarter = "q1/20", amount = 100)

【讨论】:

以上是关于将月度数据与季度数据合并?的主要内容,如果未能解决你的问题,请参考以下文章

如何在熊猫中将月度数据转换为季度

mysql 按年度季度月度周日SQL统计查询

mysql按年度季度月度周日统计查询的sql语句

根据季度定义将月度值相加

Hadoop巨头完成合并,成全球第二大开源软件公司!

在R中的几列中获取月度均值的有效方法