由于一个数据集中的列较长,合并会附加额外的值吗?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了由于一个数据集中的列较长,合并会附加额外的值吗?相关的知识,希望对你有一定的参考价值。

我尝试基于标识符列合并两个数据框:

NEI <- merge(data, classification, by = "SCC", ) 

其中数据是具有由“SCC”标识的一些测量的原始数据文件,以及具有“SCC”值的相应名称的分类文件。例如,SCC代码10010203对应于“工业废水”。

但是,SCC代码的分类列表比原始数据文件中的测量/ SCC更广泛。因此,当文件被合并时,在NEI数据帧的末尾,来自分类文件的非重叠SCC代码被附加在对应于测量和相应名称的SCC值的前面(这就是为什么我想合并文件)。

> head(NEI)
   SCC  fips Pollutant Emissions  type year                                               Short.Name
1 10100101 34017  PM25-PRI   898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal

> tail(NEI)
         SCC  fips Pollutant Emissions  type year                                                                 Short.Name
6497646 68510001 47163  PM25-PRI   2.0e-02 POINT 2005                                           Phthalate Plasticizer Production

不应添加位于NEI帧尾端的“6497646”值。正如我之前解释的那样,我认为这是因为两个文件中的两个“SCC”变量合并了文件,并且分类/索引文件中的SCC列表更长。

如何确保只将测量文件中的SCC代码合并到新帧中?

提前致谢!

答案

这些数字只是rownames,如果你不想要它们,你可以删除所有的rownames。

rownames(NEI) <- NULL

以上是关于由于一个数据集中的列较长,合并会附加额外的值吗?的主要内容,如果未能解决你的问题,请参考以下文章

在 SQL 中,我可以在另一列中获取与它们没有关联的特定值的列中的值吗?

-[NSUserDefaults registerDefaults:] 是附加的,它会覆盖值吗?

我可以使用决策树来比较属性对的值吗?

RSpec stubbed方法可以按顺序返回不同的值吗?

Excel——2个表格相同列内容填充

Union用法及说明: