R等同于SAS的“In”数据集选项,用于包含和排除重叠数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R等同于SAS的“In”数据集选项,用于包含和排除重叠数据相关的知识,希望对你有一定的参考价值。

我通常是SAS用户,但想知道在R中是否有类似的方式列出数据,这些数据只能在合并后才能在一个数据框中找到。在SAS我会使用

data want;
    merge have1 (In=in1) have2 (IN=in2) ;
    if not in2;
run;

仅在has1中查找条目。我的R代码是:

inner <- merge(have1, have2, by= "Date", all.x = TRUE, sort = TRUE)

我试过setdiff()和antijoin(),但似乎都没有给我我想要的东西。另外,我想找到一种方法来解决这个问题。我想找到has1和have2中具有相同“Date”条目的条目,然后将剩余的变量保存在2个数据帧中。例如,考虑has1与列“Date”,“ShotHeight”,“ShotDistance”和has2与列“Date”,“ThrowHeight”,“ThrowDistance”使m]新数据帧,称之为“new”具有列“Date” “,ShotHeight”,“ShotDistance”,“ThrowHeight”,“ThrowDistance”。

答案

假设只有一个变量,最简单的解决方案根本不是merge

want <- subset(have1, !(county %in% have2$county))

这个子集have1排除county值在have2中的行。

以上是关于R等同于SAS的“In”数据集选项,用于包含和排除重叠数据的主要内容,如果未能解决你的问题,请参考以下文章

SAS 转换和缺失数据

sas自定义标签可以包含多少字符

将 SAS sas7bdat 数据读入 R

交织 SAS 数据集(按常见患者编号)

谁能帮我写一个 R 数据框作为 SAS 数据集?

如何在新数据集上评分