python垃圾回收机制(超详细)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python垃圾回收机制(超详细)相关的知识,希望对你有一定的参考价值。

参考技术A 概述:引用计数为主,标记清除,分代回收为辅

1引用计数

python程序中创建的所有的对象都是放在一个双向环状循环链表refchain上的

如下对象被创建时,在C语言底层实际结构

name='string'

c语言内底部创建成 [上一个对象,下一个对象,类型,引用个数]

age=18

c语言内底部创建成[上一个对象,下一个对象,类型,引用个数,val=18]

hobby=['篮球', '撸铁',‘玩’]

c语言内底部创建成[上一个对象,下一个对象,类型,引用个数,item=元素, 元素个数]

当python程序运行时,会根据数据类型的不同找到其对应的结构体,根据结构体中的字段来进行创建相关的数据,然后将对象添加到refchain双向链表中

每个对象中有ob_refcnt就是应用计数器,默认为1,当有其他变量引用对象时,引用计数器就会+1

当引用计数器为0时,意味着没人使用这个对象了,这个对象就是垃圾,就会回收

回收步骤 :1对象从refchain链表移除  2将对象销毁,内存回收

2 标记清除

为什么要标记清除 :为了解决引用计数器循环引用的不足,循环引用可能导致内存泄漏

实现:在python的底层,再维护一个链表,链表中专门放那些可能存在循环引用的对象(list/tuple/dict/set)

在python内部,某种情况下触发,回去扫描可能存在循环引用链表中的每个元素,检查是否是循环引用,如果有,则让双方的引用计数器-1,如果是0,则垃圾回收

3 分代回收

为什么要分代回收: 不知道什么情况下触发扫描,可能存在循环引用的链表扫描代价大,每次扫描很久

将可能存在循环引用的对象维护成3个链表

0代:0代中对象个数达到700个扫描一次

1代:0代扫描10次,则1代扫描1次

2代:1代扫描10次,则2代扫描1次

过程:当我们创建了一个对象a=1,这个对象只会加到refchain链表中,而当我们创建了一个可能存在循环引用的对象b=[]一个列表时,这个对象不但会加到refchain链表中,还会加到分带回收的0代链表中,当0代链表中对象达到700个,GC开始扫描,如果是循环引用,那就自减1,减完以后,如果是垃圾,那就自动回收,如果不是垃圾,那就将这些对象升级到1代链表中,就这样扫描一遍,此时0代链表也会记录自己扫描了1次,等到下次0代链表的对象又达到了700个,继续上述步骤,就这样执行了10次,才会触发执行扫描1代链表,1代链表和2代链表中的操作和0代中一样。

4 小结(面试可以这么说)

在python中,维护了一个refchain的双向循环环状链表,这个链表中存储程序创建的所有对象,每种类型的对象中都有一个0b_refcnt引用计数器的值,默认为1,当引用计数器变为0时会进行垃圾回收(对象销毁,refchain中移除)

但是,在python 中,对于那些可以有多个元素组成的对象可能会存在循环引用的问题,为了解决这个问题,python又引入了标记清除和分代回收,在其内部维护了四个链表

refchain 

0代  700个对象触发

1代  0代十次执行一次1代

2代 1代十次执行一次2代

当 每个链表达到阈值时,就会触发扫描链表进行标记清除操作,有循环则各自-1,为0时,直接回收,销毁,清除

But, 在上面的垃圾回收机制的步骤中,python提供了优化机制

缓存

小整数对象池

为了避免重复创建和销毁一些常用对象,维护了一个小整数对象池

-5~257的地址内存是一定的,这些对象是pyhton事先帮我们创建好了

free_list(会有大小限制)

当一个对象的引用计数为0时,按理说应该回收,但是python没有回收,而是把这个对象放到了一个free_list中当缓存,以后再去使用时,不在重新开辟内存,而是直接使用free_list

比如现在一个对象V=3.14 ,我现在把他del V, 代表引用计数为0 了,但是这块地址我不会回收,而是放到free_list中,然后我又创建了一个新的对象v1=999,这个对象不会开辟一块新内存,而是直接从free_list中去获取对象,然后把对象内部的数据进行初始化成999,再放到refchain中去,需要注意的是,free_list有大小限制,如果free_list链表满了,当一个对象的引用计数为0时,会直接回收这块地址,而不会放到free_list中进行缓存

float: 维护了free_list长度为100

int:不是基于free_list, 而是维护一个small_list保持常见的数据(小数据池),重复使用不会开辟新的内存

str: 内存将所有的ascii字符缓存起来,以后使用的时候不会反复创建

list: 维护了free_list长度为80

tuple:根据元素个数来维护free_list长度

dict:维护了free_list长度为80

以上是关于python垃圾回收机制(超详细)的主要内容,如果未能解决你的问题,请参考以下文章

Python 垃圾回收机制详细

简单理解python的垃圾回收机制

简单理解python的垃圾回收机制

Python的垃圾回收机制

Python的垃圾回收机制原理

python的垃圾回收机制