python深浅拷贝

Posted waysforever

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python深浅拷贝相关的知识,希望对你有一定的参考价值。

 

一、概念引入

  在高级语言中,变量是对内存及其地址的抽象。

    对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地址,而不是这个变量的只本身。

 

    引用语义:在python中,变量保存的是对象(值)的引用,我们称为引用语义。采用这种方式,变量所需的存储空间大小一致,因为变量只是保存了一个引用。也被称为对象语义和指针语义。

    值语义:有些语言采用的不是这种方式,它们把变量的值直接保存在变量的存储区里,这种方式被我们称为值语义,例如C语言,采用这种存储方式,每一个变量在内存中所占的空间就要根据变量实际的大小而定,无法固定下来。

 

    由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中每个变量中都存储了这个变量的地址,而不是值本身;

    我们来看一张简单易懂的图理解一下python的引用语义和C语言值语义在内存中的存储情况,左右两个图,分别表示了python中变量存储与C语言中变量存储区别:

技术分享图片

    对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已,下面给出基础类型和数据结构类型变量重新赋值的存储变化:

    参考:http://www.cnblogs.com/Eva-J/p/5534037.html

二、各基本数据类型的地址存储及改变情况

在python中的数据类型包括:bool、int、long、float、str、set、list、tuple、dict等等。我们可以大致将这些数据类型归类为简单数据类型和复杂的数据结构。

如果一个数据类型,可以将其他数据类型作为自己的元素,那么我们就称该数据类型为数据结构。数据结构的分类有很多种,但是在Python中常用的只有集合、序列和映射三种结构。对应python中的set、list(tuple、str)、dict;常用的数据类型有int、long、float、bool、str等类型。

由于python中的变量都是采用的引用语义,数据结构可以包含基础数据类型,导致了在python中数据的存储是下图这种情况,每个变量中都存储了这个变量的地址,而不是值本身;对于复杂的数据结构来说,里面的存储的也只只是每个元素的地址而已。

1 my_str = "ways"
2 my_list = [0,1,2,["a","b", "c"]]
3 my_dic = {"name":"ways", "age":16}
4 print(id(my_str))
5 print(id(my_list))
6 print(id(my_list[0]),id(my_list[1]),id(my_list[2]),id(my_list[3]))
7 print(id(my_dic),id(my_dic["name"]),id(my_dic["age"]))

输出:

2131810169664
2131811101448
1837680272         1837680304      1837680336     2131810205832
2131810159136     2131810169664      1837680784

1.数据类型重新初始化对python语义引用的影响

1 a = 1234
2 print(id(a))
3 a = 456
4 print(id(a))
5 输出:
6 1947923681040
7 1947919757008

变量的每一次初始化,都开辟了一个新的空间,将新内容的地址赋值给变量。

2.数据结构内部元素变化重对python语义引用的影响

 1 >>> my_list = [1,2,3,4]
 2 >>> print(id(my_list))
 3 2250887009480
 4 >>> my_list.append("add")
 5 >>> print(id(my_list))
 6 2250887009480
 7 >>> my_list.pop()
 8 add
 9 >>> print(id(my_list))
10 2250887009480
11 >>> print(id(my_list[0]))
12 1854391984
13 >>> my_list[0]="ways"
14 >>> print(id(my_list[0]))
15 2250887017728
16 >>> my_list = [3333,44444,55555]
17 >>> print(id(my_list))
18 2250887008776

当对列表中的元素进行一些增删改的操作的时候,是不会影响到my_list列表本身对于整个列表地址的,只会改变其内部元素的地址引用。可是当我们对于一个列表重新初始化(赋值)的时候,就给my_list这个变量重新赋予了一个地址,覆盖了原本列表的地址,这个时候,my_list列表的内存id就发生了改变

三、查看变量内存地址

 

>>> a = 1
>>> print(id(a))
>>>1473627824

四、浅copy

概念:浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层

1 import copy
2 source_date = [1,2,3,4,5,[10,11,12]]
3 copy_date = copy.copy(source_date)
4 print("source:", id(source_date))
5 print("copy_date", id(copy_date))
6 输出:
7 source: 2062740001480
8 copy_date 2062740002632
 1 source_date.append("sourcedate")
 2 copy_date.append("copydate")
 3 print("source:", source_date)
 4 print("copy_date",copy_date)
 5 copy_date[5][0] =6666
 6 print("source:", source_date)
 7 print("copy_date",copy_date)
 8 source_date[5][0] = ["ways"]
 9 print("source:", source_date)
10 print("copy_date",copy_date)
11 source_date[5] = ["ways","alex"]
12 print("source:", source_date)
13 print("copy_date",copy_date)
14 输出:
15 source: [1, 2, 3, 4, 5, [10, 11, 12], sourcedate]
16 copy_date [1, 2, 3, 4, 5, [10, 11, 12], copydate]
17 source: [1, 2, 3, 4, 5, [6666, 11, 12], sourcedate]
18 copy_date [1, 2, 3, 4, 5, [6666, 11, 12], copydate]
19 source: [1, 2, 3, 4, 5, [[ways], 11, 12], sourcedate]
20 copy_date [1, 2, 3, 4, 5, [[ways], 11, 12], copydate]
21 source: [1, 2, 3, 4, 5, [ways, alex], sourcedate]
22 copy_date [1, 2, 3, 4, 5, [[ways], 11, 12], copydate]

五、深copy

深拷贝会完全复制原变量相关的所有数据,在内存中生成一套完全一样的内容,在这个过程中我们对这两个变量中的一个进行任意修改都不会影响其他变量。

 1 source_str = ["ways","tanks","yang",[1,2,3]]
 2 copy_str = copy.deepcopy(source_str)
 3 print(id(source_str),id(source_str[0]),id(source_str[3]),id(source_str[3][0]))
 4 print(id(copy_str),id(copy_str[0]),id(copy_str[3]),id(copy_str[3][0]))
 5 source_str[3][1] = 6666
 6 print(id(source_str),id(source_str[0]),id(source_str[3]),id(source_str[3][1]))
 7 print(id(copy_str),id(copy_str[0]),id(copy_str[3]),id(copy_str[3][1]))
 8 输出:
 9 2354768160392 2354767917832 2354768160584 1833617072
10 2354768160328 2354767917832 2354768160200 1833617072
11 2354768160392 2354767917832 2354768160584 2354733559504
12 2354768160328 2354767917832 2354768160200 1833617104

六、总结

  • Python中对象的赋值都是进行对象引用(内存地址)传递
  • 使用copy.copy(),可以进行对象的浅拷贝,它复制了对象,但对于对象中的元素,依然使用原始的引用.
  • 如果需要复制一个容器对象,以及它里面的所有元素(包含元素的子元素),可以使用copy.deepcopy()进行深拷贝

 




以上是关于python深浅拷贝的主要内容,如果未能解决你的问题,请参考以下文章

我要学python之深浅拷贝原理

Python 的深浅拷贝 终于明白了

python深浅拷贝

python 深浅拷贝,集合 ,小数据池 操作

Python高级语法-深浅拷贝-总结(4.2.1)

Python深浅拷贝