由于一个数据集中的列较长,合并会附加额外的值吗?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了由于一个数据集中的列较长,合并会附加额外的值吗?相关的知识,希望对你有一定的参考价值。
我尝试基于标识符列合并两个数据框:
NEI <- merge(data, classification, by = "SCC", )
其中数据是具有由“SCC”标识的一些测量的原始数据文件,以及具有“SCC”值的相应名称的分类文件。例如,SCC代码10010203对应于“工业废水”。
但是,SCC代码的分类列表比原始数据文件中的测量/ SCC更广泛。因此,当文件被合并时,在NEI数据帧的末尾,来自分类文件的非重叠SCC代码被附加在对应于测量和相应名称的SCC值的前面(这就是为什么我想合并文件)。
> head(NEI)
SCC fips Pollutant Emissions type year Short.Name
1 10100101 34017 PM25-PRI 898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal
> tail(NEI)
SCC fips Pollutant Emissions type year Short.Name
6497646 68510001 47163 PM25-PRI 2.0e-02 POINT 2005 Phthalate Plasticizer Production
不应添加位于NEI帧尾端的“6497646”值。正如我之前解释的那样,我认为这是因为两个文件中的两个“SCC”变量合并了文件,并且分类/索引文件中的SCC列表更长。
如何确保只将测量文件中的SCC代码合并到新帧中?
提前致谢!
答案
这些数字只是rownames,如果你不想要它们,你可以删除所有的rownames。
rownames(NEI) <- NULL
以上是关于由于一个数据集中的列较长,合并会附加额外的值吗?的主要内容,如果未能解决你的问题,请参考以下文章
在 SQL 中,我可以在另一列中获取与它们没有关联的特定值的列中的值吗?