保留具有特定单词的行[重复]

Posted

技术标签:

【中文标题】保留具有特定单词的行[重复]【英文标题】:Keep rows with have a specific word [duplicate] 【发布时间】:2020-05-25 17:23:18 【问题描述】:

使用此命令,它会保留具有特定单词的行

df[df$ID == "interesting", ]

如果该单词存在于该行中,但它有更多单词围绕如何找到该单词是否存在并保留该行。

示例输入

data.frame(text = c("interesting", " I am interesting for this", "remove")

预期输出

data.frame(text = c("interesting", " I am interesting for this")

【问题讨论】:

?grepldf[grepl("interesting", df$text),] 应该这样做。 【参考方案1】:

1.示例数据:

df <- data.frame(text = c("interesting", " I am interesting for this", "remove"),
                 stringsAsFactors = FALSE)

使用基础 R 的解决方案。使用 grepl 的索引:

df[grepl("interesting", df$text), ]

这会返回:

[1] "interesting"                " I am interesting for this"

编辑 1

更改代码,使其返回 data.frame 而不是向量。

df[grep("interesting", df$text), , drop = FALSE]

现在返回:

                        text
1                interesting
2  I am interesting for this

【讨论】:

以上是关于保留具有特定单词的行[重复]的主要内容,如果未能解决你的问题,请参考以下文章

根据列子集删除重复项,保留列 E 中具有最高值的行,如果 E 中的值相等,则列 B 中具有最高值的行

删除重复行但保留最早的行(按日期标准) - SQL Server

MySQL删除重复行保留一个[关闭]

关于保留一列值满足某些约束的行[重复]

T-SQL:删除所有重复的行但保留一个[重复]

Pandas:如何删除重复的行,但保留所有行的最大值[重复]