R具有不同值的重复ID变量[重复]

Posted

技术标签:

【中文标题】R具有不同值的重复ID变量[重复]【英文标题】:R duplicate ID variables with different values [duplicate] 【发布时间】:2015-08-09 18:02:14 【问题描述】:

我有一个看起来像这样的数据框;

head(x)
user_id    location
1          New York
1          Chicago
2          Atlanta
3          San Antonio

我想删除重复的行(即 user_id 1),而不考虑它们的位置。所以我需要一个新的数据框,它只有唯一的 ID,但仍然有一个位置(所以对于 ID 1,它是芝加哥还是纽约都没有关系)。

【问题讨论】:

x[!duplicated(x$user_id), ]... 你能提供一个更好的代码吗,这个代码似乎已经是你要找的了,因为它有一个重复的行,但它们属于不同的位置。或者,如果案件忽略我的评论,我可能会错过一些东西。 你可以使用 dplyr 包中的distinct():***.com/questions/22959635/… 【参考方案1】:

你可以试试

x[!duplicated(x$user_id), ]
  user_id    location
1       1    New_York
3       2     Atlanta
4       3 San_Antonio

【讨论】:

以上是关于R具有不同值的重复ID变量[重复]的主要内容,如果未能解决你的问题,请参考以下文章

同一表中具有不同值的重复字段

删除具有一个不同值的重复行[重复]

需要 SQL 在不同的列中查找具有重复值的记录

SQL - 选择最大具有不同值的重复项

查找指定列的重复行[重复]

休眠:具有相同标识符值的不同对象已与会话相关联[重复]