在Python中使用字典替换子字符串[重复]

Posted 2023-02-23

技术标签:

【中文标题】在Python中使用字典替换子字符串[重复]【英文标题】：Substitute substrings using a dictionary in Python [duplicate] 【发布时间】：2016-02-03 20:57:28 【问题描述】：

我有这个字符串

message = '10100010011'

还有这本词典

codes = 97: '1', 98: '01', 107: '001', 114: '000'

我需要使用字典将原始消息替换为类似的内容

[97, 98, 114, 97, 107, 97]

我尝试了我自己的方法，这很有效，但是当我使用一些非常大的字符串时，它真的很慢。还有比这更快的方法吗？

    codes = dict(zip(codes.values(), codes.keys()))
    decoded_mess = []
    pom = ""
    for i in message:
        pom += i
        if pom in codes:
            decoded_mess.append(codes[pom])
            pom = ""

我在Easiest way to replace a string using a dictionary of replacements? 看到了答案，我试过了，但这对我不起作用。可能是因为他们处理的是整个单词，但我有 1 长串 1 和 0。

【问题讨论】：

你的字典是不是弄错了？键（或值，目前）不应该都有固定的长度吗？ @jonrsharpe 他在解决方案中交换键值。 @MarounMaroun 哦...那为什么要单独显示呢？！鉴于当前的限制，您无法更有效地做到这一点。如果你有固定长度的键，那会更容易（因为你可以将字符串切成适当的长度来开始，而不是建立它直到匹配为止）。 @jonrsharpe 这些键（1、01、001、000）看起来可能是霍夫曼编码。 【参考方案1】：

首先，codes 字典应该是向后的，以便于查找。我的策略是一次扫描一个字符的消息。如果找到替代品，请将其退回。如果没有，请添加下一个字符并再次查找。继续这样做，直到找到替换或消息用完为止。

def seach_replace(buffer, codes):
    codes = v: k for k, v in codes.items()  # Reverse the key, value
    text_so_far = ''
    for c in buffer:
        text_so_far += c
        if text_so_far in codes:
            yield codes[text_so_far]
            text_so_far = ''
    if text_so_far:
        yield text_so_far

if __name__ == '__main__':
    message = '10100010011'
    codes = 97: '1', 98: '01', 107: '001', 114: '000'
    print(list(seach_replace(message, codes)))

输出：

[97, 98, 114, 97, 107, 97]

【讨论】：

这any与OP的策略有何不同？除了使用生成器之类的语义之外？ @Shashank：生成器通过不创建累积列表来使用更少的内存。

以上是关于在Python中使用字典替换子字符串[重复]的主要内容，如果未能解决你的问题，请参考以下文章