如何使用 .join() 避免在循环中连接字符串? - Python

Posted

技术标签:

【中文标题】如何使用 .join() 避免在循环中连接字符串? - Python【英文标题】:How to use .join() to avoid concatenating a string within a loop? - Python 【发布时间】:2021-09-23 18:04:38 【问题描述】:

我正在使用 for 循环构造一个正则表达式查询,如下所示:

query = '^(?:'
for num, element in enumerate(my_list):
  values = element.split('-')
  if num > 0:
    query += '|'
  for v in values:
    query += f'(?=.*v)'
query += ')'

my_list = ['a-b', 'b-c']

但是,我认为这是低效的,因为这会导致二次运行,因此可能无法很好地扩展。

如何转换此流程以避免这种低效率?

我在想一些与 .join() 方法相关的事情,但我很困惑这在我的情况下如何工作,因为它对我来说似乎并不简单。

【问题讨论】:

“二次运行时”相对于什么? 缺少一个左括号 添加括号,谢谢@azro @ScottHunter 有人告诉我,这种方法的总序列长度的运行时间成本是二次方 请描述这是要做什么。你最终会得到(?=.*a(?=.*b)|(?=.*b)(?=.*c),这是一个相当昂贵的正则表达式,而且由于这些是“非消耗”匹配,我真的不知道你想要实现什么。 【参考方案1】:

这将使用joins 模拟上述内容;请注意,这对使用生成的查询的性能没有影响。

'^?:' + "|".join(["".join(['(?=.*%s)' % v for v in element.split('-')]) for element in my_list]) + ")"

【讨论】:

以上是关于如何使用 .join() 避免在循环中连接字符串? - Python的主要内容,如果未能解决你的问题,请参考以下文章

如何使用连接缓冲区(块嵌套循环)错误修复MySql的LEFT JOIN?

在 R / dplyr 中循环完全连接

Python入门-4控制语句:09循环代码优化技巧(重要)-zip()并行迭代

MySQL中3表join流程分析

在 SELECT ... INNER JOIN ... FOR UPDATE 的情况下,字符串的顺序是啥锁定以及如何避免死锁?

前端性能优化:字符串的连接操作改进