Python代码块缓存小数据池

Posted 2022-01-04 gongziqianqiu

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python代码块缓存小数据池相关的知识，希望对你有一定的参考价值。

引子
前几天遇到了这样一道Python题目：a=‘123’，b=‘123’，下列哪个是正确的？

A. a != b

B. a is b

C. a==123

D. a + b =246
正确答案是B
是的，我选错了，我当时觉得没有正确答案，原因是我当时已经知道Python中 == 与 != 是比较两边的数值是否相等，很显然 a==b，我也知道 is 比较的是两边的内存地址是否相同，而内存地址是否相同是通过比较 id(a) 是否等于id(b)来知道的，而我想当然地认为a和b是两个不一样的变量，内存地址肯定不相同，于是认为B选项是错误的。然而，我不知道的是，Python中还存在有代码块缓存、小数据池的概念。对于Python我只是直接上手写代码了，觉得很简单，然而对于其背后的深层知识还有很多欠缺，以后需要多多学习和记录总结。
代码块的缓存机制
代码块
Python程序是由代码块构造的，一个模块、一个函数、一个类、一个文件等都是一个代码块，特别地，在Python解释器交互环境中，每个命令都是一个代码块。
缓存机制
Python在执行同一个代码块时，遇到初始化变量的命令时，它会将初始化的这个变量与其值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果该变量对应的值的记录已经存在，则该变量会重复使用这个值，即会把前后两个变量指向同一个值对象，值对象在内存中只存在一个。这就是代码块的缓存机制，缓存机制的适用类型有：int、float、str、bool。

int、float：任何数字在同一代码块下都会复用；
bool：True和False在字典中会以1和0的方式存在，因此也都会被复用；
str：缓存机制符合一下规则：

非乘法得到的字符串都会被缓存复用，如；

s1=‘中文xa#[email protected]()&^$$ksjfkls‘
s2=‘中文xa#[email protected]()&^$$ksjfkls‘
print(s1 is s2) # True

乘法得到的字符串分两种情况：
1）乘数为1时，同非乘法得到的字符串一样，都满足代码块的缓存机制，如：

s1=‘中文xa#[email protected]()&^$$ksjfkls‘ 1
s2=‘中文xa#[email protected]()&^$$ksjfkls‘ 1
print(s1 is s2) # True

2）乘数>=2时，仅包含大小写字母、数字、下划线并且总长度 <=20 的字符串才满足代码块的缓存机制，如：
s1=‘中文xa#[email protected]()&^$$ksjfkls‘ 2
s2=‘中文xa#[email protected]()&^$$ksjfkls‘ 2
print(s1 is s2) # False 总长度超过20且包含除字母、数字、下划线的字符

s3=‘中文xa#[email protected]‘ * 2
s4=‘中文xa#[email protected]‘ * 2
print(s3 is s4) # False 包含除字母、数字、下划线的字符

s5=‘2a_j‘ * 6
s6=‘2a_j‘ * 6
print(s5 is s6) # False 总长度超过20

s7=‘2a_j‘ * 5
s8=‘2a_j‘ * 5
print(s7 is s8) # True

小数据池
小数据池即小整数缓存机制，Python自动将 -5～256 之间的整数进行了缓存，也将一定规则的字符串在字符串驻留池中创建了一份，即在内存中只创建一份。它主要是针对不同代码块之间的缓存机制。
1.int ：小数据池的范围是 -5～256，多个变量都指向在此范围内的同一个数字时，它们在内存中都指向同一个内存地址，超过此范围则指向不同的内存地址，以命令行为例（每行命令为一个代码块，不同行的命令为不同的代码块）：