如何比较两个数据帧的内容? [重复]

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何比较两个数据帧的内容? [重复]相关的知识,希望对你有一定的参考价值。

给定两个数据帧A和B,其中A长于B.A行中的值必须存在于B行中。如果B中不存在A行,则应删除它。最后A应该有像B这样的线。我需要一个for循环吗?感谢您的帮助,我希望我能很好地说明问题。

for example:

x=c(1,3,7,1,1,4,3)
y=c(2,5,5,6,2,6,4)
A<-cbind.data.frame(x,y)

x2<-c(1,3,5,1,3)
y2<-c(2,4,7,6,8)
B<-cbind.data.frame(x2,y2)



##A should like this at the end
```
x<-c(1,1,1,3)
y<-c(2,6,2,4)
A<-c(x,y)
```
答案

我以前用过的东西:

i = interaction(A,sep=":")%in%interaction(B,sep=":")
i
TRUE FALSE FALSE  TRUE  TRUE FALSE  TRUE

A[i,]
  x y
1 1 2
4 1 6
5 1 2
7 3 4

这里做的是连接带有您确定不会在数据中遇到的符号的列(:),然后比较这两个向量。它为我节省了很多时间。

以上是关于如何比较两个数据帧的内容? [重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何查找两个word文档中重复的内容

如何逐行比较两个数据框?

如何找到两个数据帧的补码

pyspark 内连接的替代方法来比较 pyspark 中的两个数据帧

如何获取多索引数据帧的前两个索引的字典

如何使用具有不同列号pyspark的两个数据帧的并集