根据 R 中列中的值过滤数据框

Posted

技术标签:

【中文标题】根据 R 中列中的值过滤数据框【英文标题】:Filtering a dataframe based on a value from column in R 【发布时间】:2017-08-15 05:18:56 【问题描述】:

我有一个如下所示的数据框 df

 sample  variant            
1 HLA1    1,3,4,5            
2 HLA2    1,5 
3 HLA3    2,3
4 HLA4 
5 HLA5    1
6 HLA6    1,4,3
7 HLA7    1
8 HLA8    4,3

我想提取所有带有“1”的行。例如,这是我需要的输出

 sample  variant            
1 HLA1    1,3,4,5            
2 HLA2    1,5 
3 HLA5    1
4 HLA6    1,4,3
5 HLA7    1

所以我认为这会起作用

CF <- df[df$variant=="1"]

这给了我如下

 sample  variant 
1 HLA5    1
2 HLA7    1

任何人都可以帮助在 R 中实现这一点。我在这里简化了我的案例,实际上数据框运行到超过十万行。谢谢

【问题讨论】:

df[grepl("1", df$variant), ] 谢谢你..这工作! 【参考方案1】:

我假设df$variant 的类是'character'

然后您可以使用df[grepl('1',df$variant),]

【讨论】:

以上是关于根据 R 中列中的值过滤数据框的主要内容,如果未能解决你的问题,请参考以下文章

重命名数据框中列中的字符变量 - R

做某事。如果在熊猫数据框中列中的值等于 1

动态填充pyspark数据框中列中的行

计算数据框中列中的组

使用 Filter 或 If Else 根据 R 中另一列中的值过滤指标

根据列中的条件对数据框中的行进行子集/过滤