使用列值筛选行作为另一个数据集的条件

Question

这非常棘手。比方说，我有一个第一个数据集df：

sample   id                  name
1        ID200,ID300,ID299   first
2        ID2,ID123           second
3        ID90                third

第二个数据集df_1：

ids       condition
ID200        y
ID300        n
ID299        n
ID2          y
ID123        y
ID90         n

我必须从第一个数据集中过滤掉所有ID值满足第二个表中条件的所有行，如y。所以这个例子中的过滤应该给出：

 sample   id                  name
 2        ID2,ID123           second

我在考虑使用类似的东西：

new_df = df %>%
  filter(grepl('ID', id), df_1$condition == 'y')

但显然我需要一些不同的东西，你能给我一些线索吗？

编辑：正如我在评论中所说，如果我的df的id列填充了其他文本，会发生什么？

sample   id                                         name
1              ID = ID200,ID300,ID299,abcd          first
2              ID = ID2,ID123, dfg                  second
3              ID = ID90, text                      third

Answer 1

另一答案