Python优化提速小技巧:字符串拼接使用join而非+
Posted 以梦为马&不负韶华
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python优化提速小技巧:字符串拼接使用join而非+相关的知识,希望对你有一定的参考价值。
一、原理分析:
使用a + b拼接字符串: 由于 Python 中字符串是不可变对象,其会申请一块内存空间,将a和b分别复制到该新申请的内存空间中。因此,如果要拼接 n 个字符串,会产生 n-1 个中间结果,每产生一个中间结果都需要申请和复制一次内存,严重影响运行效率。
使用join()拼接字符串时: 会首先计算出需要申请的总的内存空间,然后一次性地申请所需内存,并将每个字符串元素复制到该内存中去。
所以join比+进行字符串拼接效率要高。
二、join和+效率分析:
1.字符串拼接join和+的简单用法:
str1 = ":".join(["fmk","hello"])
str2 = "fmk:" + "hello"
print(str1) # fmk:hello
print(str2) # fmk:hello
2.使用+进行字符串拼接(不推荐):
import time
# 使用+进行字符串进行拼接
def add_test(strlist):
result = ""
for i in strlist:
result = result + i
return result
if __name__ == "__main__":
str_list = [f"{n}" for n in range(1000000)]
start_time = time.time()
add_test(str_list)
end_time = time.time()
print(end_time - start_time)
耗时:1.1925122737884521
3.使用join进行字符串拼接(推荐):
import time
# 使用join进行字符串拼接
def join_test(strlist):
return "".join(strlist)
if __name__ == "__main__":
str_list = [f"{n}" for n in range(1000000)]
start_time = time.time()
join_test(str_list)
end_time = time.time()
print(end_time - start_time)
耗时:0.015622138977050781
三、总结:
可以明显看到,在把1百万所有数字拼接为字符串时,join字符串拼接需要的时间比+字符串拼接时间快1s
当拼接的字符串个数不大时,影响不大,达到较大级别时,我们就可以人为感知到,但是性能优化本来就是在多个地方一点点积累起来的。
所以在拼接字符串的时候,我们应考虑优先使用join。
以上是关于Python优化提速小技巧:字符串拼接使用join而非+的主要内容,如果未能解决你的问题,请参考以下文章