Python优化提速小技巧:字符串拼接使用join而非+

Posted 以梦为马&不负韶华

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python优化提速小技巧:字符串拼接使用join而非+相关的知识,希望对你有一定的参考价值。

一、原理分析:

使用a + b拼接字符串: 由于 Python 中字符串是不可变对象,其会申请一块内存空间,将a和b分别复制到该新申请的内存空间中。因此,如果要拼接 n 个字符串,会产生 n-1 个中间结果,每产生一个中间结果都需要申请和复制一次内存,严重影响运行效率
使用join()拼接字符串时: 会首先计算出需要申请的总的内存空间,然后一次性地申请所需内存,并将每个字符串元素复制到该内存中去。
所以join比+进行字符串拼接效率要高

二、join和+效率分析:

1.字符串拼接join和+的简单用法:

str1 = ":".join(["fmk","hello"])
str2 = "fmk:" + "hello"
print(str1) # fmk:hello
print(str2) # fmk:hello

2.使用+进行字符串拼接(不推荐):

import time

# 使用+进行字符串进行拼接
def add_test(strlist):
    result = ""
    for i in strlist:
        result = result + i
    return result


if __name__ == "__main__":
    str_list = [f"{n}" for n in range(1000000)]
    start_time = time.time()
    add_test(str_list)
    end_time = time.time()
    print(end_time - start_time)

耗时:1.1925122737884521

3.使用join进行字符串拼接(推荐):

import time


# 使用join进行字符串拼接
def join_test(strlist):
    return "".join(strlist)


if __name__ == "__main__":
    str_list = [f"{n}" for n in range(1000000)]
    start_time = time.time()
    join_test(str_list)
    end_time = time.time()
    print(end_time - start_time)

耗时:0.015622138977050781

三、总结:

可以明显看到,在把1百万所有数字拼接为字符串时,join字符串拼接需要的时间比+字符串拼接时间快1s
当拼接的字符串个数不大时,影响不大,达到较大级别时,我们就可以人为感知到,但是性能优化本来就是在多个地方一点点积累起来的。
所以在拼接字符串的时候,我们应考虑优先使用join。

以上是关于Python优化提速小技巧:字符串拼接使用join而非+的主要内容,如果未能解决你的问题,请参考以下文章

Java中代码优化的30个小技巧

Java代码优化的30个小技巧

Python爬虫提速小技巧,多线程与多进程(附源码示例)

python中一些简单的代码优化细节

几个压箱底的 tips,Python 提速不是一点点

几个压箱底的 tips,Python 提速不是一点点