如何从 R 数据框中过滤列的唯一组合

Posted

技术标签:

【中文标题】如何从 R 数据框中过滤列的唯一组合【英文标题】:How to filter for unique combination of columns from an R dataframe 【发布时间】:2012-01-11 21:25:26 【问题描述】:

我正在尝试从 R 中的数据框中过滤掉列子集的重复项。

我对过滤会话、第一个和最后一个的独特组合感兴趣。以下是我的数据的样子

                        session       first     last            city
1  9cf571c8faa67cad2aa9ff41f3a26e38     cat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a   caleb     amos                
3  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
4  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5 charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d  carrie mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705    fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a  aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37  andrew    price       yorkville

【问题讨论】:

【参考方案1】:

以下应该这样做:

unique(df[,c('session','first','last')])

df 是您的数据框。

【讨论】:

你也数一数吗? @Climbs_lika_Spyder nrow(unique(df[,c('session','first','last')]))

以上是关于如何从 R 数据框中过滤列的唯一组合的主要内容,如果未能解决你的问题,请参考以下文章

如何在组合框 vba 中过滤数据

检索任意行以获取数据框中列的唯一组合

如何通过 Pyspark 中同一数据框中另一列的正则表达式值过滤数据框中的一列

如何从位于访问中的另一个子窗体中的组合框中过滤子窗体?

过滤 Pyspark 中列的动态唯一组合

如何计算熊猫数据框中每一列的唯一性?