python基本数据类型

Posted 2021-01-02

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python基本数据类型相关的知识，希望对你有一定的参考价值。

python可变和不可变对象

python中所有的数据都是围绕对象来构建，这些对象可分为两类：可变对象和不可变对象。当变量被赋值，变量中存放的是对象引用（可以理解为C语言中的指针），指向内存中存放该对象的区域。
对于不可变对象而言，对象本身不可以改变（也可以理解为对象的值不可以改变），可以改变的是指向该对象的引用。
对于可变对象而言，对象本身的内容可以改变，指向该对象的引用不变~

不可变对象

不可变对象有：int，string，float，tuple...
不可变对象一旦创建，该对象本身就不能改变。若变量的值需要改变，只能重新创建对象，并改变变量的引用，如下图所示：
技术分享图片

原来的对象不再被引用，会被当做垃圾回收~，可以使用 id() 函数做如下验证：

>>> abc = 1
>>> id(abc)
1456500192

>>> abc=2
>>> id(abc)
1456500224

可变对象

可变对象有：list，dict...
可变对象的内容可以改变，而变量的引用不会发生改变，如下图所示：
技术分享图片

可以看到，对于可变对象，变量值的变化不需要重新创建对象，在python中可变对象往往是容器对象（即一个对象包含对其他对象的引用）

>>> abc=[‘a‘,‘b‘]
>>> id(abc)
2768889238408

>>> abc+=[‘c‘]
>>> id(abc)
2768889238408
>>> abc
[‘a‘, ‘b‘, ‘c‘]

在python中可以通过 is 判断两个变量是否引用自同一个对象，示例如下：

>>> a = 1
>>> b = 1
>>> a is b
True

>>> c = 2
>>> a is c
False

由于python中存在小整数对象池，[-5,257)范围内的整数对象，python解释器不会重复创建~

python基本数据类型

数字

python中的数字有很多种，包括：整型，长整型，布尔，浮点，复数。数字一经定义，不可更改（不可变对象）

-- 整型

python中的整型用八进制，十进制，十六进制表示：

# 环境为 python3
>>> 1                # 默认为十进制
1

>>> oct(8)        # 八进制，"0o" 为前缀，python2.7中的前缀为"0"，10表示为‘010‘
‘0o10‘

>>> hex(10)      # 十六进制，前缀为0X或0x
‘0xa‘

数据类型转换，可使用 int() 转换为整型：

>>> a = ‘12‘
>>> b = int(a)       # 字符串类型转换为整型
>>> b
12

>>> int(1.2)          # 浮点数转换为整型，小数部分会被略去
1

--长整型

python2中的整型有长度的限制，32位系统上长度为32位，取值范围为-2**31～2**31-1；64位系统上长度为64位，取值范围为-2**63～2**63-1。
python3中的长整型没有长度限制，可以无限大，但是这受到内存大小的限制（就是不可能无限大）

# 环境为 python2.7
>>> a = 1              # 定义整型
>>> a   
1
>>> b = 2L            # 定义长整型
>>> b
2L

>>> a = 9999999999999999999999999999999999
>>> a
9999999999999999999999999999999999L

通过在数字后面加上大写L 或者小写l 表示长整型；在定义整型时，若数据的位数超过了限制范围，则会默认转换为长整型

Tip：在python3中，整型和长整型归为一类：整数类型 int

--布尔型bool

True 和 False，或者用1和0表示：1 表示True，0表示False~
在条件判断时，若条件语句返回为非零数值、非空字符串、非空list等，均表示为True，否则表示为False。

if []:
    print(‘OK‘)
else:
    print(‘NO‘)

结果输出：
NO

while 1:                 # 等效于while true，无限循环
    print(‘hello world‘)

--浮点数float

python中的浮点数也就是小数，可用普通的方式表示，例如：

1.23，3.56 ...

也可以使用科学计数法表示：

1.23*10^9就是1.23e9，或者12.3e8         # 小数位数太多时，用科学计数法表示~
0.000012可以写成1.2e-5

整数和浮点数在计算机内部存储的方式是不同的，整数运算是精确的，而浮点数运算则可能会有
四舍五入的误差。

--复数complex

复数由实数部分和虚数部分组成，一般形式为x＋yj，其中的x是复数的实数部分，y是复数的虚数部分，这里的x和y都是实数。虚数部分的字母j大小写都可以~
&gt;&gt; a = 1.3 + 2.5j
&gt;&gt; a
(1.3+2.5j)
&gt;&gt; type(a)
<class ‘complex‘&gt;

数值的运算这里不做介绍

字符串

字符串是一个有序的字符集合，且字符串为不可变对象，一经创建，不可更改~

--创建字符串

python字符串的创建可以使用单引号，也可以使用双引号

str1 = ‘Hello‘
str2 = "World"

单引号或双引号前面加 r ，可以使字符串中的特殊字符失效，按原样输出：

>>> print(‘abc	de‘)
abc     de
>>> print(r‘abc	de‘)
abc	de

当 r 与 unicode字符串一起使用时，u 需要放在 r 的前面

str1 = ur‘abc	de

--常用字符串运算

var1 = ‘Hello‘; var2 = ‘Kitty‘

# 字符串拼接
var1 + var2       # 输出：‘HelloKitty‘

# 重复输出
var1 * 3            # 输出：‘HelloHelloHello‘

# 成员运算，判断字符是否存在于指定字符串中
‘t‘ in var2          # 输出：True，存在返回True

‘a‘ not in var2   # 输出：True，不存在返回True

# 原始字符串输出，字符串中的转移字符失效，在引号前使用 R 或 r 均可~
print(r‘	
‘)     # 输出：	

print(R‘	
‘)    # 输出：

--三引号（triple quotes）使用

python中的三引号，用于跨行输出，例如要输出如下语句：

line1---
line2---
line3---

方式一：

>>> str1 = "line1---
line2---
line3---"
>>> str1
‘line1---
line2---
line3---‘
>>> print(str1)
line1---
line2---
line3---

方式二（3对单引号还是3对双引号，结果一样）Pycharm环境：

str2 = ‘‘‘line1---
line2---
line3---‘‘‘
print(str2)

输出结果：
line1---
line2---
line3---

3对双引号""" """ 或者 3对单引号 ‘‘‘ ‘‘‘ 还可以表示多行注释（其中 # 为当行注释）：

class Abc():
  """
    多行注释
    多行注释
    多行注释
    """
  def __init__(self):
      pass
  def say_hello(self):
      # 单行注释
      # 单行注释
      return ‘hello‘

--字符串常用操作

----字符串索引

>>> my_str = ‘hello‘
>>> my_str[4]
‘o‘

>>> my_str[-3]        # 最后第3个字符
‘l‘

----截取字符串

>>> my_str = ‘hello‘
>>> my_str[1:4]        # 截取其中的 第2个到第5个 字符
‘ell‘

>>> my_str[:4]
‘hell‘                          # 截取其中的 第1个到第4个 字符，不包括 my_str[4]

>>> my_str[3:]
‘lo‘                            # 截取其中的 第4个到最后1个字符

>>> my_str[:-3]
‘he‘                           # 截取第1个到最后第3个字符（不包括最后第3个）

>>> my_str[-3:-1]
‘ll‘                            # 截取倒数第3个到倒数第1个字符（不包括倒数第一个）

>>> my_str[-3:]
‘llo‘                           # 截取倒数第3个到最后一个字符

>>> my_str[::-1]
‘olleh‘                       # 生成一个与原字符串顺序相反的字符串

----切割、合并字符串
按字符串中的字符，切割字符串

>>> my_str = ‘a,b,c,d,e‘
>>> my_str.split(‘,‘)
[‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘]             # 返回列表

合并列表或元组中的元素成字符串

>>> ‘:‘.join([‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘])     # 列表
‘a:b:c:d:e‘

>>> ‘#‘.join((‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘))   元组
‘a#b#c#d#e‘

----其他操作

>>> my_str = ‘ abc ‘
>>> len(my_str)       # 获取字符串长度
5

# 移除字符串两边空白
>>> my_str.strip()
‘abc‘

# 移除字符串左边空白
>>> my_str.lstrip()
‘abc ‘

# 移除字符串右边空白
>>> my_str.rstrip()
‘ abc‘

# 查找字符
>>> my_str.index(‘b‘)    # 若字符串中没有该字符，会返回报错信息
2

# 查找字符串
S.find(substr, [start, [end]])     # [start, [end]] 指定起始位置和结束位置
>>> my_str.find(‘bc‘)
2                                 # 返回查找到的字符串的第一个字符的索引，若没有找到，返回-1

# 搜索和替换
S.replace(oldstr, newstr, [count])   # count 指定替换次数
>>> my_str.replace(‘b‘,‘B‘,2)
‘aBc aBc abc‘

>>> my_str = ‘abCD efg‘
>>> my_str.lower()               # 都转为小写
‘abcd efg‘
>>> my_str.upper()              # 都转为大写
‘ABCD EFG‘
>>> my_str.swapcase()       # 大小写互换
‘ABcd EFG‘
>>> my_str.capitalize()        # 首字母大写
‘Abcd efg‘

使用 str() 将其他类型的数据转换成字符串

>>> str(123456)
‘123456‘
>>> str([‘a‘,‘b‘,‘c‘])
"[‘a‘, ‘b‘, ‘c‘]"

列表

列表两边使用 [] 包含，[] 中可以存放多种类型的数据，每个数据之间使用逗号（，）分隔。列表数据可变对象~

--创建列表

方式一：my_lst1 = [‘a‘, 1, 2]
方式二：my_lst2 = list(‘abc‘)
方式三：my_lst3 = list([‘a‘, 1, 2])

创建空列表：

my_lst = []
my_lst = list()

--列表常用操作

# 索引
>>> my_lst = [‘a‘,‘b‘,‘c‘,‘d‘]
>>> my_lst[2]
‘c‘

# 搜索列表元素
>>> my_lst.index(‘c‘)
2                           # 返回index，若没有对应元素，返回报错信息

# 列表长度
>>> len(my_lst)
4

# 列表的切片，使用方式与字符串类似，不做意义注释
>>> my_lst = [‘a‘,‘b‘,‘c‘,‘d‘]
>>> my_lst[1:3]
[‘b‘, ‘c‘]
>>> my_lst[:3]
[‘a‘, ‘b‘, ‘c‘]
>>> my_lst[2:]
[‘c‘, ‘d‘]
>>> my_lst[:-2]
[‘a‘, ‘b‘]
>>> my_lst[-3:-1]
[‘b‘, ‘c‘]
>>> my_lst[-3:]
[‘b‘, ‘c‘, ‘d‘]
>>> my_lst[::-1]
[‘d‘, ‘c‘, ‘b‘, ‘a‘]

# 追加元素（append追加）
>>> my_lst = [1,2,3]
>>> my_lst.append(4)         # [1, 2, 3, 4]

# 追加元素（extend追加）
>>> my_lst = [1,2,3]
>>> my_lst.extend([4,5])     # [1, 2, 3, 4, 5]

# append与 extend 的区别在于，append 直接追加对象，extend 会迭代对象中的每个元素，然后进行追加
>>> my_lst = [1,2,3]
>>> my_lst.append([4, 5])     # [1, 2, 3, [4, 5]]
>>> my_lst = [1,2,3]
>>> my_lst.extend([4, 5])      # [1, 2, 3, 4, 5]

# 指定索引位置插入元素
>>> my_lst = [1,2,3]
>>> my_lst.insert(-1, ‘a‘)       # 最后一个元素前面插入
>>> my_lst
[1, 2, ‘a‘, 3]
>>> my_lst.insert(0, 0)        # 第一个元素前面插入
>>> my_lst
[0, 1, 2, ‘a‘, 3]

# 删除元素
>>> a = my_lst.pop()     # 不加参数默认删除最后一个元素，并将删除元素返回
>>> my_lst
[0, 1, 2, ‘a‘]
>>> a
3
# pop() 指定参数，通过所应删除
>>> my_lst.pop(1)
1
>>> my_lst
[0, 2, ‘a‘]

# 删除列表中的指定值 li.remove(‘aa‘)
>>> my_lst.remove(‘a‘)     # 若列表中没有该元素，返回报错信息
>>> my_lst
[0, 2]

# 通过 索引和切片 删除元素
>>> my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘]
>>> del my_lst[0:2]
>>> my_lst
[‘c‘, ‘d‘]

# 清空列表
>>> my_lst.clear()
>>> my_lst
[]

# 列表元素出现的次数
>>> my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘a‘]
>>> my_lst.count(‘a‘)
2
>>> my_lst.count(‘g‘)
0

# 翻转列表
>>> my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘]
>>> my_lst.reverse()
>>> my_lst
[‘d‘, ‘c‘, ‘b‘, ‘a‘]

----列表中的 in 操作（返回布尔值）
判断元素是否存在于列表中~

>>> my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘]
>>> print(‘a‘ in my_lst)
True
>>> print(‘z‘ in my_lst)
False

--循环列表

这里仅介绍 for 循环

my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘]
for i in my_lst:
    print(i)

for i in range(len(my_lst)):
    print(my_lst[i])

以上两种方式的输出结果一致~

可以使用 enumerate 函数连同 index 一起输出，首先了解下 enumerate：

my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘]
for i in enumerate(my_lst):
    print(i)

输出：
(0, ‘a‘)
(1, ‘b‘)
(2, ‘c‘)
(3, ‘d‘)
(4, ‘e‘)

# 所以可以这样使用：
my_lst = [‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘]
for index, value in enumerate(my_lst):
    print(‘%s --> %s‘ % (index, value))

输出：
0 --> a
1 --> b
2 --> c
3 --> d
4 --> e

Tip：enumerate的第二个参数，可改变起始序号，可以自己尝试~

元组和字符串可通过 list() 转换成列表，这也是初始化列表的方法之一

lst_1 = list((1,2,3))     # [1, 2, 3]
lst_2 = list(‘abc‘)        # [‘a‘, ‘b‘, ‘c‘]

来自字典的转换

>>> my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
>>> list(my_dict)                  # 将字典中的 keys 转为 list
[‘a‘, ‘b‘, ‘c‘]
或者
>>> list(my_dict.keys())
[‘a‘, ‘b‘, ‘c‘]

>>> list(my_dict.values())     # 将字典中的 values 转为list
[1, 2, 3]

元组

元组与列表类似，使用 () 包含其元素；元组与列表的最大区别在于，元组为不可变对象，一经创建，其内容无法更改。

--创建元组

tup_1 = (‘a‘, ‘b‘, 1, 2)
tup_2 = (1, 2, 3, 4)
tup_3 = ‘a‘, ‘b‘, ‘c‘, ‘d‘

创建空元组

tup_4 = ()

创建仅包含一个元素的元组：

>>> tup_4 = (2)   # 这样创建 tup_4 会被当做 int 类型，而不是 tuple；
>>> type(tup_4)
<class ‘int‘>

# 正确创建方式
>>> tup_4 = (2,)
>>> type(tup_4)
<class ‘tuple‘>

--元组常用操作

元组的索引操作（tup[index]），搜索元素（tup.index()），获取长度（len(tup)），切片（tup(1:3)），元素出现的次数（tup.count()）等这些操作与 list 一致~

因为 tuple 为不可变对象，所以不支持 append，insert，extend，pop，remove，del，clear 等操作

>>> tup_1 = (1,2,3)
>>> tup_1[1] = 4
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: ‘tuple‘ object does not support item assignment

tuple 不支持 sort 和 reverse 操作，支持 sorted 操作，返回类型为列表

>>> tup_1 = (2,3,90,6,234,1,53,2)
>>> sorted(tup_1)
[1, 2, 2, 3, 6, 53, 90, 234]

tuple同样也支持 in 操作：

>>> my_tup = (‘a‘,‘b‘,‘c‘,‘d‘)
>>> print(‘a‘ in my_tup)
True
>>> print(‘z‘ in my_tup)
False

上述对 list 的循环操作，同样也适用于tuple~

tuple() 可应用于 list，字符串，将其转换成 tuple 类型的数据

tup_1 = tuple("abcdefg")      # (‘a‘, ‘b‘, ‘c‘, ‘d‘, ‘e‘, ‘f‘, ‘g‘)
tup_2 = tuple([1,2,3,4,5])     # (1, 2, 3, 4, 5)

来自字典的转换，与list类似

list(my_dict.keys())  或者 list(my_dict)    # 将字典中的 keys 转成tuple
list(my_dict.values())                              # 将字典中的 values 转成tuple

字典

字典也属于可变对象，使用一对花括号 {} 包含元素，字典中的每个元素为一个 key->value对，key和value之间使用冒号 : 分割，每个元素之间使用逗号隔开~

Tip：dict中的key必须是不可变对象，或者说是可hash类型（例如元组可以作为key），value可以是可变对象，也可以是不可变对象~

--创建字典

d1 = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
d2 = dict({‘a‘: 1, ‘b‘: 2, ‘c‘: 3})
d3 = dict(a=1, b=2, c=3)    # 这种方式定义字典，key 只能是字符串类型
d4 = dict([(‘a‘, 1), (‘b‘, 2), (‘c‘, 3)])

# 初始化字典
d6 = {}.fromkeys([‘a‘, ‘b‘], None)  # {‘a‘: None, ‘b‘: None}
d7 = {}.fromkeys([‘a‘,‘b‘], [1, 2])   # {‘a‘: [1, 2], ‘b‘: [1, 2]}

创建空字典：

d1={}; 
d2=dict();

字典的循环（d.keys，d.values， for i in d取出的是key）
dict.get(key)
dict.setdefault()

--字典常用操作

# 获取字典元素
>>> my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
>>> my_dict[‘b‘]
2

# 使用 get 方法获取，若没有指定的 key 返回为 None
>>> my_dict.get(‘b‘)
2

# 当只有一个参数时，setdefault的作用域get类似，查找指定的key，若没有返回None。当指定的key没有时，不光会返回 None ，还会在字典中添加该 key ，且值为None
>>> my_dict.setdefault(‘c‘)
3
>>> my_dict.setdefault(‘d‘)
>>> my_dict
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3, ‘d‘: None}

# 添加的 key，也可以指定 value
>>> my_dict.setdefault(‘e‘, 5)
5
>>> my_dict
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3, ‘d‘: None, ‘e‘: 5}

# 添加操作
>>> my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
>>> my_dict[‘d‘] = 4
>>> my_dict
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3, ‘d‘: 4}

# 修改操作
>>> my_dict[‘d‘] = 40
>>> my_dict
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3, ‘d‘: 40}

# 删除操作
>>> my_dict.pop(‘a‘)
1
>>> my_dict
{‘b‘: 2, ‘c‘: 3, ‘d‘: 40}

# 清空字典
>>> my_dict.clear()
>>> my_dict
{}

# update操作，将 一个字典中（d_1）的元素更新到 另一个字典（d_2）中，若d_1中的key，d_2中也有，则d_1中的key更新d_2中的key，若d_1中的key，d_2中没有，则在d_2中进行添加，示例如下：
>>> d_1 = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
>>> d_2 = {‘a‘: 12, ‘x‘: 10, ‘y‘: 20, ‘z‘: 30}
>>> d_1.update(d_2)
>>> d_1
{‘a‘: 12, ‘b‘: 2, ‘c‘: 3, ‘x‘: 10, ‘y‘: 20, ‘z‘: 30}

--对字典的循环操作

字典的 items() 函数以列表形式返回可遍历的(键, 值) 元组。

my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
for i in my_dict.items():
    print(i)
结果输出：
(‘a‘, 1)
(‘b‘, 2)
(‘c‘, 3)

keys()，values()

my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
for i in my_dict.keys():                    # keys() 获取字典的所有 key， 并以列表形式返回
    print(i)
结果输出：
a
b
c

my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
for i in my_dict.values():                 # values() 获取字典的所有 value， 并以列表形式返回
    print(i)
结果输出：
1
2
3

在python2中，也有items()，keys()，values()函数，返回的是一个字典的拷贝列表（items，keys或values），对应的还有iteritems()，iterkeys()，itervalues()，返回字典所有items（key，value）的一个迭代器，前者会占用额外内存，后者不会

在python3中，废弃了iteritems()，iterkeys()，itervalues()函数，使用items()，keys()，values()替代，其返回结果与python2中的iteritems()，iterkeys()，itervalues()一致

遍历字典也可以不使用上述的函数：

my_dict = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3}
for key in my_dict:                          # 遍历字典中的所有key
    print(my_dict[key])

--dict() 转换的使用

列表转字典
方式一：

>>> ls_key = [‘a‘, ‘b‘, ‘c‘]
>>> ls_value = [1, 2, 3]
>>> dict(zip(ls_key, ls_value))
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3}

方式二：

>>> ls_key_value = [[‘a‘, 1], [‘b‘, 2], [‘c‘, 3]]
>>> dict(ls_key_value)
{‘a‘: 1, ‘b‘: 2, ‘c‘: 3}

字符串转为字典
方式一：

import json
user_str = ‘{"name" : "Kitty", "gender" : "female", "age": 18}‘
# user_str = "{‘name‘ : ‘Kitty‘, ‘gender‘ : ‘female‘, ‘age‘: 18}"   # 必须写成上面这种形式（双引号），不能使用单引号，这也是使用 json 方式的缺陷
user_dict = json.loads(user_str)     # {"name" : "Kitty", "gender" : "female", "age": 18}

方式二：

user_str = ‘{"name" : "Kitty", "gender" : "female", "age": 18}‘
user_dict = eval(user_str)       # {‘name‘: ‘Kitty‘, ‘gender‘: ‘female‘, ‘age‘: 18}

Tip：使用eval不存在向json这样的问题，但是eval存在安全性问题，所以不建议使用~

方式三：

import ast
user_str = ‘{"name" : "Kitty", "gender" : "female", "age": 18}‘
user_dict = ast.literal_eval(user_str)    # {‘name‘: ‘Kitty‘, ‘gender‘: ‘female‘, ‘age‘: 18}

Tip：ast.literal_eval 不存在 json 的问题，也没有安全性问题，推荐使用~

集合

集合（set）是一个无序不重复元素的序列。集合中只能存放不可变对象（可hash的）~

--创建集合

使用 {} 或者 set() 创建集合

my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}      # 推荐使用
# 或者
my_set = set([‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘])
my_set = set({‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘})
my_set = set((‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘))

# 创建的集合为：{‘python‘, ‘java‘, ‘go‘, ‘ruby‘}

# 集合中不可存放可变对象
>>> my_set = {[1,2,3], ‘abc‘}
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: ‘list‘

Tip：由于集合中的元素不可重复，重复的元素仅保留一个

创建空集合

my_set = set()      # 不能使用 {}，{} 会创建一个空的字典

--集合常用操作

# 添加元素，add() 操作，若元素已经存在，则不进行任何操作
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> my_set.add(‘c‘)
>>> my_set
{‘go‘, ‘ruby‘, ‘c‘, ‘python‘, ‘java‘}

# 更新集合，update操作，已存在的元素，不进行操作，不存在的元素进行添加
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> my_set.update({‘go‘,‘php‘,‘c‘})
>>> my_set
{‘go‘, ‘ruby‘, ‘c‘, ‘python‘, ‘php‘, ‘java‘}

# 删除元素
# remove，从集合中移除元素，若不存在，报错~
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> my_set.remove(‘python‘)
>>> my_set
{‘go‘, ‘ruby‘, ‘java‘}
>>> my_set.remove(‘php‘)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: ‘php‘

# discard，从集合中移除元素，元素不存在不会报错
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> my_set.discard(‘ruby‘)
>>> my_set.discard(‘php‘)
>>> my_set
{‘go‘, ‘python‘, ‘java‘}

# pop，随机从集合中删除一个元素，并返回被删除的元素
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> my_set.pop()
‘go‘
>>> my_set
{‘python‘, ‘ruby‘, ‘java‘}

# 计算集合中元素个数
>>> len(my_set)
3

# 清空集合
>>> my_set.clear()
>>> my_set
set()

# 判断集合是否包含某个元素，存在返回True，否则返回False~；对应的还有not in
>>> my_set = {‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘}
>>> ‘java‘ in my_set
True
>>> ‘erlang‘ in my_set
False

--集合运算

>>> my_set_1 = {‘Apple‘, ‘Facebook‘, ‘Amazon‘}
>>> my_set_2 = {‘Apple‘, ‘Google‘, ‘Alibaba‘}

----并集 union

>>> my_set_1 | my_set_2
{‘Apple‘, ‘Amazon‘, ‘Google‘, ‘Alibaba‘, ‘Facebook‘}

# 对应方法
>>> my_set_1.union(my_set_2)
{‘Apple‘, ‘Amazon‘, ‘Google‘, ‘Alibaba‘, ‘Facebook‘}

----交集 intersection

>>> my_set_1 & my_set_2
{‘Apple‘}

# 对应方法
>>> my_set_1.intersection(my_set_2)
{‘Apple‘}

----差集 difference

>>> my_set_1 - my_set_2
{‘Amazon‘, ‘Facebook‘}

# 对应方法
>>> my_set_1.difference(my_set_2)
{‘Amazon‘, ‘Facebook‘}

----对称差集 sysmmetric difference

>>> my_set_1 ^ my_set_2
{‘Alibaba‘, ‘Amazon‘, ‘Google‘, ‘Facebook‘}

# 对应方法
>>> my_set_1.symmetric_difference(my_set_2)
{‘Alibaba‘, ‘Amazon‘, ‘Google‘, ‘Facebook‘}

可使用 set() 将list，tuple，dict，字符串转换成集合

my_set = set([‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘])
my_set = set((‘python‘, ‘ruby‘, ‘java‘, ‘python‘, ‘go‘))
my_set = set({‘a‘:1, ‘b‘:2, ‘c‘:3})       # 仅获取 keys，转换后的集合 {‘a‘, ‘c‘, ‘b‘}
my_set = set(‘abcdefg‘)                  # {‘e‘, ‘c‘, ‘f‘, ‘d‘, ‘b‘, ‘a‘, ‘g‘}

.................^_^

以上是关于python基本数据类型的主要内容，如果未能解决你的问题，请参考以下文章

python 用于数据探索的Python代码片段（例如，在数据科学项目中）

13 个非常有用的 Python 代码片段