集合是一个无序的,不重复的数据组合。
它的特点是:
- 唯一性
- 无序性
- 不支持索引
它的主要作用是:
- 去重,把一个列表变成集合,就自动去重了。
- 关系测试,测试两组数据之间的交集、差集、并集等。
集合的常用操作
创建
>>> a = set(‘abcde‘) #字符串创建 >>> print(a) {‘b‘, ‘d‘, ‘e‘, ‘c‘, ‘a‘} >>> b = set([‘ab‘,‘cd‘,‘ef‘,‘gh‘]) #列表创建 >>> print(b) {‘ab‘, ‘ef‘, ‘gh‘, ‘cd‘}
去重
>>> list1 = [1,2,3,4,5,4,3,2,1] >>> list1 [1, 2, 3, 4, 5, 4, 3, 2, 1] >>> set1 = set(list1) >>> set1 {1, 2, 3, 4, 5}
增加
{1, 2, 3, 4, 5} >>> set1.add(6) >>> set1 {1, 2, 3, 4, 5, 6} >>> set1.add([8,7,9]) #不可直接加列表 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: ‘list‘ >>> set1.add(a) #不可直接加集合 Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: unhashable type: ‘set‘ >>> set1.add(‘a‘) >>> set1 {1, 2, 3, 4, 5, 6, ‘a‘}
>>> set1.update([6,7,8]) >>> set1 {1, 2, 3, 4, 5, 6, 7, 8, ‘a‘} >>> set1.update(‘b‘) >>> set1 {1, 2, 3, 4, 5, 6, 7, 8, ‘b‘, ‘a‘} >>> set1.update(9) #update跟的必须是iterable Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: ‘int‘ object is not iterable
删除
>>> set1.remove(8) >>> set1 {1, 2, 3, 4, 5, 6, 7, ‘b‘, ‘a‘} >>> set1.remove([6,7]) Traceback (most recent call last): #不能直接跟列表进行删除 File "<stdin>", line 1, in <module> TypeError: unhashable type: ‘list‘
>>> set2 {1, 2, 3, 4, 5, 6, 7, ‘b‘, ‘a‘} >>> set2.pop() #弹出集合中任意一个元素 1 >>> set2 {2, 3, 4, 5, 6, 7, ‘b‘, ‘a‘} >>> set2.discard(3) #删除一个元素,该元素不存在也不会报错 >>> set2.discard(3) >>> set2 {2, 4, 5, 6, 7, ‘b‘, ‘a‘}
复制
>>> set1 {1, 2, 3, 4, 5, 6, 7, ‘b‘, ‘a‘} >>> set2 = set1.copy() >>> set2 {1, 2, 3, 4, 5, 6, 7, ‘b‘, ‘a‘}
集合内置方法
参考链接:http://blog.csdn.net/jasonLee_lijiaqi/article/details/79307119