使用R函数将数据框列中的字符串替换为“”

Posted

技术标签:

【中文标题】使用R函数将数据框列中的字符串替换为“”【英文标题】:Replace a string of characters to " " in a data frame column using R function 【发布时间】:2016-11-01 14:52:14 【问题描述】:

Screenshot of the dataframe

我想将data77298$SAMPLE.CODE 中第一个 _ 之后的所有内容替换为“”,这样我就可以得到 GSM2048265、GSM2048266 等级别,

是否可以使用单个命令将下划线后的所有字符串更改为空?

【问题讨论】:

欢迎来到 ***。请查看有关如何生成minimum, complete, and verifiable example 的这些提示,以及creating a great example in R 上的这篇文章。也许asking a good question 上的以下提示也值得一读。 将示例输入文本直接发布在您的问题中会有所帮助 【参考方案1】:

您可以通过gsub 进行操作

my_string<-c("GSM2048265_Somet_323_h4554ing_here","GSM2048266_sometwewe_sdsd_hing_here")
gsub("\\_.*","",my_string)
[1] "GSM2048265" "GSM2048266"

【讨论】:

这有帮助!谢谢!【参考方案2】:

怎么样:

library(stringr)
my_string<-c("GSM2048265_1_2_£_$_F_CA","GSM2048266_aasv_vaerv_vasd", "GSM2048266_arvqb_oyor_1234")
word(my_string, 1, sep = "_")

【讨论】:

以上是关于使用R函数将数据框列中的字符串替换为“”的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 MultiIndex 在 Python 数据框列中进行字符串替换

使用部分字符串匹配将数据框中的列替换为另一个数据框列

用另一个值替换熊猫数据框列中的几个值

Pyspark 删除数据框列中的多个字符

如何删除数据框列中的空格并向其添加字符串“NA”?

替换数据框R列中的字符