替换/翻译字符串中的字符

Posted

技术标签:

【中文标题】替换/翻译字符串中的字符【英文标题】:Replace / translate characters in a string 【发布时间】:2011-10-20 16:58:15 【问题描述】:

我有一个带有字符列的数据框:

df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
df
#        var1
# 1 aabbcdefg
# 2 aabbcdefg

我想替换几个不同的单个字符,例如从“a”到“h”,从“b”到“i”等等。目前我多次调用gsub:

df$var1 <- gsub("a", "h", df$var1)
df$var1 <- gsub("b", "i", df$var1)
df$var1 <- gsub("c", "j", df$var1)
df$var1 <- gsub("d", "k", df$var1)
df$var1 <- gsub("e", "l", df$var1)
df$var1 <- gsub("f", "m", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg

不过,我相信还有更优雅的解决方案。有什么想法可以继续吗?

【问题讨论】:

【参考方案1】:

您可以创建fromto 向量:

from <- c('a','b','c','d','e','f')
to <- c('h','i','j','k','l','m')

然后向量化gsub函数:

gsub2 <- function(pattern, replacement, x, ...) 
for(i in 1:length(pattern))
x <- gsub(pattern[i], replacement[i], x, ...)
x

这给出了:

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df$var1 <- gsub2(from, to, df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg

【讨论】:

@jrara 我应该如何修改代码以进行有条件的替换?在下面的例子中,我想替换 Mech,Oper 和 Eng,只有当它们被缩短时,我不想在完整的单词中替换它们(即不是 Mech in Mechanical,或 Oper in Operations) 这里是例子:from &lt;- ("Mech", "Oper", "Eng") to &lt;- ("Mechanical", "Operations", "Engineer") data.frame(var1 = c("Mech", "Mechanical Engineer", "Oper", "Operations")) 应该是标准函数,太棒了!【参考方案2】:

你想要chartr:

df$var1 <- chartr("abcdef", "hijklm", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg

【讨论】:

【参考方案3】:

如果您不想使用chartr,因为替换可能不止一个字符,那么另一种选择是使用gsubfn 包中的gsubfn(我知道这不是gsub,而是gsub 的扩展)。这是一个例子:

> library(gsubfn)
> tmp <- list(a='apple',b='banana',c='cherry')
> gsubfn('.', tmp, 'a.b.c.d')
[1] "apple.banana.cherry.d"

替换也可以是一个函数,它接受匹配并返回该匹配的替换值。

【讨论】:

以上是关于替换/翻译字符串中的字符的主要内容,如果未能解决你的问题,请参考以下文章

PHP 替换翻译字符串内的参数

用字典值替换 Pandas Dataframe 中的部分字符串

自动翻译程序员英语

【翻译】在Rust中字符串如何匹配?

Android - 如何用另一个字符串替换部分字符串?

Postgresql 中的 REGEXP_REPLACE 不是子字符串