在 R 中使用合并函数时重复行 - 但我不想要总和

Posted

技术标签:

【中文标题】在 R 中使用合并函数时重复行 - 但我不想要总和【英文标题】:Duplicate rows while using Merge function in R - but I dont want the sum 【发布时间】:2016-12-19 12:12:48 【问题描述】:

所以这是我的问题,我有大约 40 个数据集,所有 csv 文件只包含两列,(a) 日期和 (b) 价格(对于每个数据集,价格列被命名为其国家)。我使用合并函数如下,将所有数据合并为一个数据集,其中包含一个日期列和多个价格列。这是我使用的功能:

merged <- Reduce(function(x, y) merge(x, y, by="Date", all=TRUE), list(a,b,c,d,e,g,h,i,j,k,l,m,n,o,p,q,r,s,t,u,v,w,x,y,z,aa,ab,ac,ad,ae,af,ag,ah,ai,aj,ak,al,am,an))

发生的情况是,例如,我在日期列中有 3 个相同日期的值,但相应的国家/地区值被拆分。例如:

# Date          India China South Korea

# 01-Jan-2000   5445   NA   4445   NA
# 01-Jan-2000   NA    1234  NA     NA
# 01-Jan-2000   NA     NA   NA    5678

我真的想要

# 01-Jan-2000   5445  1234  4445  5678

我不知道如何得到这个,因为与该主题相关的其他问题要求对我显然不需要的值求和。这是一个简单的例子。不幸的是,我有大约 43 个国家从 2000 年 1 月到 2016 年 11 月的每日数据,全都搞砸了。任何解决此问题的帮助将不胜感激。

【问题讨论】:

欢迎来到 ***!请阅读有关how to ask a good question 的信息以及如何提供reproducible example。这将使其他人更容易帮助您。 您可以聚合具有sumna.rm-参数设置为TRUE 的列。 See here for a generic example. 【参考方案1】:

我将使用rbind 附加所有数据帧,并使用spread() 重塑结果。由于合并取决于您开始使用的数据框。

可重现的例子:

library(dplyr)

a <- data.frame(date = Sys.Date()-1:10, cntry = "China", price=round(rnorm(10,20,5),2))
b <- data.frame(date = Sys.Date()-6:15, cntry = "Netherlands", price=round(rnorm(10,50,10),2))
c <- data.frame(date = Sys.Date()-11:20, cntry = "USA", price=round(rnorm(10,70,25),2))


all <- do.call(rbind, list(a,b,c))


all %>% group_by(date) %>% spread(cntry, price)

结果:

         date China Netherlands   USA
*      <date> <dbl>       <dbl> <dbl>
1  2016-11-29    NA          NA 78.75
2  2016-11-30    NA          NA 66.22
3  2016-12-01    NA          NA 86.04
4  2016-12-02    NA          NA 17.07
5  2016-12-03    NA          NA 75.72
6  2016-12-04    NA       46.90 39.57
7  2016-12-05    NA       51.80 65.11
8  2016-12-06    NA       57.50 96.36
9  2016-12-07    NA       46.42 46.93
10 2016-12-08    NA       45.71 57.63
11 2016-12-09 15.41       60.09    NA
12 2016-12-10 16.66       60.07    NA
13 2016-12-11 23.72       66.21    NA
14 2016-12-12 19.82       45.46    NA
15 2016-12-13 14.22       45.07    NA
16 2016-12-14 27.26          NA    NA
17 2016-12-15 20.08          NA    NA
18 2016-12-16 15.79          NA    NA
19 2016-12-17 17.66          NA    NA
20 2016-12-18 26.77          NA    NA

【讨论】:

以上是关于在 R 中使用合并函数时重复行 - 但我不想要总和的主要内容,如果未能解决你的问题,请参考以下文章

已解决:axios 在循环中重复一个请求,但我不想要这个 | axios [重复]

R的merge怎么出现很多行重复

R的merge怎么出现很多行重复

mysql总和,带有行ID

矩阵的行乘积和矩阵的列和

使用合并时删除某些行