10 Python 数据类型—集合

Posted 潘红伟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了10 Python 数据类型—集合相关的知识,希望对你有一定的参考价值。

  在Python set基本数据类型的一种集合类型,它有可变集合(set())和不可变集合(frozenset)两种。创建集合set集合set添加集合删除交集并集差集的操作都是非常实用的方法。

  1. python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.  
  2. sets 支持 x in set, len(set),和 for x in set。作为一个无序的集合,sets不记录元素位置或者插入点。因此,sets不支持 indexing, slicing, 或其它类序列(sequence-like)的操作。 
技术分享
1 x = set(spam)
2 y = set([h,a,m])
3 z = {1, 4, 5, 3, 7, 8}
4 print(x, y, z)
5 
6 {a, m, s, p} {a, h, m} {1, 3, 4, 5, 7, 8}
集合
技术分享
 1 x = set(spam)
 2 y = set([h,a,m])
 3 z = {1, 4, 5, 3, 7, 8}
 4 print(x, y, z)
 5 print(x & y)  # 交集
 6 
 7 {m, a}
 8 print(x | y)  # 并集
 9 
10 {p, s, m, h, a}
11 print(x - y)
12 print(y - x)  # 差集
13 
14 {p, s}
15 {h}
交集,并集, 差集

  集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:

    去重,把一个列表变成集合,就自动去重了。

    关系测试,测试两组数据之前的交集、差集、并集等关系

1,集合的创建

技术分享
1 set1 = set({1,2,barry})
2 set2 = {1,2,barry}
3 print(set1,set2)  # {1, 2, ‘barry‘} {1, 2, ‘barry‘}
View Code

2,集合的增

技术分享
 1 set1 = {alex,wusir,ritian,egon,barry}
 2 set1.add(景女神)
 3 print(set1)
 4 
 5 #update:迭代着增加
 6 set1.update(A)
 7 print(set1)
 8 set1.update(老师)
 9 print(set1)
10 set1.update([1,2,3])
11 print(set1)
View Code

3,集合的删

技术分享
 1 set1 = {alex,wusir,ritian,egon,barry}
 2 
 3 set1.remove(alex)  # 删除一个元素
 4 print(set1)
 5 
 6 set1.pop()  # 随机删除一个元素
 7 print(set1)
 8 
 9 set1.clear()  # 清空集合
10 print(set1)
11 
12 del set1  # 删除集合
13 print(set1)
View Code

4,集合的其他操作:

  4.1 交集。(&  或者 intersection)

技术分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 & set2)  # {4, 5}
4 print(set1.intersection(set2))  # {4, 5}
View Code

  4.2 并集。(| 或者 union)

技术分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 | set2)  # {1, 2, 3, 4, 5, 6, 7}
4 
5 print(set2.union(set1))  # {1, 2, 3, 4, 5, 6, 7}
View Code

  4.3 差集。(- 或者 difference)

技术分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 - set2)  # {1, 2, 3}
4 print(set1.difference(set2))  # {1, 2, 3}
View Code

  4.4反交集。 (^ 或者 symmetric_difference)

技术分享
1 set1 = {1,2,3,4,5}
2 set2 = {4,5,6,7,8}
3 print(set1 ^ set2)  # {1, 2, 3, 6, 7, 8}
4 print(set1.symmetric_difference(set2))  # {1, 2, 3, 6, 7, 8}
View Code

  4.5子集与超集

技术分享
1 set1 = {1,2,3}
2 set2 = {1,2,3,4,5,6}
3 
4 print(set1 < set2)
5 print(set1.issubset(set2))  # 这两个相同,都是说明set1是set2子集。
6 
7 print(set2 > set1)
8 print(set2.issuperset(set1))  # 这两个相同,都是说明set2是set1超集。
View Code

5,frozenset不可变集合,让集合变成不可变类型。

技术分享
1 s = frozenset(barry)
2 print(s,type(s))  # frozenset({‘a‘, ‘y‘, ‘b‘, ‘r‘}) <class ‘frozenset‘>
View Code

二,深浅copy

  1,先看赋值运算。

技术分享
 1 l1 = [1,2,3,[barry,alex]]
 2 l2 = l1
 3 
 4 l1[0] = 111
 5 print(l1)  # [111, 2, 3, [‘barry‘, ‘alex‘]]
 6 print(l2)  # [111, 2, 3, [‘barry‘, ‘alex‘]]
 7 
 8 l1[3][0] = wusir
 9 print(l1)  # [111, 2, 3, [‘wusir‘, ‘alex‘]]
10 print(l2)  # [111, 2, 3, [‘wusir‘, ‘alex‘]]
View Code

    对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。

  2,浅拷贝copy。

技术分享
 1 l1 = [1,2,3,[barry,alex]]
 2 
 3 l2 = l1.copy()
 4 print(l1,id(l1))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2380296895816
 5 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2380296895048
 6 
 7 l1[1] = 222
 8 print(l1,id(l1))  # [1, 222, 3, [‘barry‘, ‘alex‘]] 2593038941128
 9 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2593038941896
10 
11  
12 l1[3][0] = wusir
13 print(l1,id(l1[3]))  # [1, 2, 3, [‘wusir‘, ‘alex‘]] 1732315659016
14 print(l2,id(l2[3]))  # [1, 2, 3, [‘wusir‘, ‘alex‘]] 1732315659016
View Code

    对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性。

  3,深拷贝deepcopy。

技术分享
 1 import copy
 2 l1 = [1,2,3,[barry,alex]]
 3 l2 = copy.deepcopy(l1)
 4 
 5 print(l1,id(l1))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167816
 6 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167048
 7 
 8 l1[1] = 222
 9 print(l1,id(l1))  # [1, 222, 3, [‘barry‘, ‘alex‘]] 2915377167816
10 print(l2,id(l2))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167048
11 
12 l1[3][0] = wusir
13 print(l1,id(l1[3]))  # [1, 222, 3, [‘wusir‘, ‘alex‘]] 2915377167240
14 print(l2,id(l2[3]))  # [1, 2, 3, [‘barry‘, ‘alex‘]] 2915377167304
View Code

    对于深copy来说,两个是完全独立的,改变任意一个的任何元素(无论多少层),另一个绝对不改变。


以上是关于10 Python 数据类型—集合的主要内容,如果未能解决你的问题,请参考以下文章

python学习--数据类型详解(序列类型,集合,字典)

Python基础

Python基本数据类型

python 数据类型 --- 集合

Python基础数据类型(数字字符串布尔列表元组字典集合等)

Python数据类型-集合(set)