python不可变对象

Posted harvyxu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python不可变对象相关的知识,希望对你有一定的参考价值。

python对象分类中已经 介绍了python不可变对象,下面将列举实例,详细分析:

不可变类型(数字,字符串,元组,不可变集合):不支持原处修改。

 

引用

>>> a=345  
>>> b=a  
>>> a is b  
True  
>>>  

在python一切皆是对象,而对象是通过引用传递的。在赋值时,不管这个对象是新创建的,还是一个已经存在的,都是将该对象的引用赋值给变量。故这里a实际上和b是同一个对象,a is b为true!

 

1 数字类型(以int型为例)

一般,尝试修改数字对象,实际上是新建一个数字对象,如下所示。

#新建数字对象1000
>>> id(1000)
53060472L

#新建数字对象1000
>>> y = 1000
>>> id(y)
53060328L

#尝试操作修改数字对象,实际上生成新的数字对象
>>> y = y + 1
>>> y
1001
>>> id(y)
53058744L

(1)但有一个特例,对于小整数[-5, 256]。考虑到小整数可能频繁使用,出于性能考虑,Python使用小整数对象缓冲池small_ints缓存了[-5,257)之间的整数,该范围内的整数在Python系统中是共享的。小整数对象在py启动过程中初始化,这些个小整数对象的ob_refcnt不会改变且永远>0,所以在vm运行过程中不会被销毁,所以起到了缓冲的作用。

(2)对于超出了[-5, 257)之间的其他整数,Python同样提供了专门的缓冲池(通用整数对象的缓冲池),供这些所谓的大整数使用,避免每次使用的时候都要不断的malloc分配内存带来的效率损耗。通过free-list,管理空闲空间。

(3)Python中的int对象就是c语言中long类型数值的扩展。

(4)整数对象回收时,内存并不会归还给系统,而是将其对象的ob_type指向free_list,供新创建的对象使用。

>>> x  = -5
>>> id(x)
8676152L
>>> y = -5
>>> id(y)
8676152L
>>> x = -6
>>> id(x)
53060472L
>>> y = -6
>>> id(y)
53059080L
>>> x = 200
>>> id(x)
8681192L
>>> y = 200
>>> id(y)
8681192L

 

2 字符串类型

比如对于不可变对象str,进行操作:

>>> a = \'abc\'
>>> id(a)
52053576L

#引用新生成的对象
>>> b = a.replace(\'a\',\'A\')
>>> id(b)
47950704L
>>> id(a)
52053576L
>>> b
\'Abc\'

要始终牢记的是,a是变量,而\'abc\'才是字符串对象!有些时候,我们经常说,对象a的内容是\'abc\',但其实是指,a本身是一个变量,它指向的对象的内容才是\'abc\'

当我们调用a.replace(\'a\', \'A\')时,实际上调用方法replace是作用在字符串对象\'abc\'上的,而这个方法虽然名字叫replace,但却没有改变字符串\'abc\'的内容。相反,replace方法创建了一个新字符串\'Abc\'并返回,如果我们用变量b指向该新字符串,就容易理解了,变量a仍指向原有的字符串\'abc\',但变量b却指向新字符串\'Abc\'了:

所以,对于不变对象来说,调用对象自身的任意方法,也不会改变该对象自身的内容。相反,这些方法会创建新的对象并返回,这样,就保证了不可变对象本身永远是不可变的。

而对可变对象(e.g list)进行操作时,会改变对象自身的内容(in-place change)。

>>> list1 = [6, 1, 5]
>>> id(list1)
55271368L
>>> list1.append(2)
>>> id(list1)
55271368L

 

3 tuple(元组)

当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来。

最后来看一个“可变的”tuple:

>>> t = (\'a\', \'b\', [\'A\', \'B\'])
>>> t
(\'a\', \'b\', [\'A\', \'B\'])
>>> hash(t)

Traceback (most recent call last):
File "<pyshell#179>", line 1, in <module>
hash(t)
TypeError: unhashable type: \'list\'

>>> t[2][0] = \'X\'
>>> t[2][1] = \'Y\'
>>> t
(\'a\', \'b\', [\'X\', \'Y\'])

这个tuple定义的时候有3个元素,分别是\'a\'\'b\'和一个list。不是说tuple一旦定义后就不可变了吗?怎么后来又变了?

别急,我们先看看定义的时候tuple包含的3个元素:

tuple-0

当我们把list的元素\'A\'\'B\'修改为\'X\'\'Y\'后,tuple变为:

tuple-1

表面上看,tuple的元素确实变了,但其实变的不是tuple的元素,而是list的元素。tuple一开始指向的list并没有改成别的list,所以,tuple所谓的“不变”是说,tuple的每个元素,指向永远不变。即指向\'a\',就不能改成指向\'b\',指向一个list,就不能改成指向其他对象,但指向的这个list本身是可变的!

理解了“指向不变”后,要创建一个内容也不变的tuple怎么做?那就必须保证tuple的每一个元素本身也不能变。

参考:

Python源码--整数对象(PyIntObject)的内存池  

整数对象实现原理

python之小整数对象初探 -- 推荐博客

使用list和tuple

python引用和对象理解

python 的 tuple 是不是冗余设计

 

以上是关于python不可变对象的主要内容,如果未能解决你的问题,请参考以下文章

Python 可变对象和不可变对象

python中的可变参数和不可变参数

Python中的可变对象和不可变对象

python可变对象和不可变对象

python中的引用传递,可变对象,不可变对象,list注意点

python 引用