Python基础数据类型（数字字符串布尔列表元组字典集合等）

Posted 2020-11-14 dongye95

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Python基础数据类型（数字字符串布尔列表元组字典集合等）相关的知识，希望对你有一定的参考价值。

数据类型

　　计算机顾名思义就是可以做数学计算的机器，因此，计算机程序理所当然地可以处理各种数值。但是，计算机能处理的远不止数值，还可以处理文本、图形、音频、视频、网页等各种各样的数据，不同的数据，需要定义不同的数据类型。在Python中，能够直接处理的数据类型有以下几种。

一 Number（数字）

1.1 数字类型的创建

a=10
b=a
b=666
 
print(a)#10
print(b)#666

注意这里与C的不同：

#include <stdio.h>
void main(void)
{
 
    int a = 1;
    int b = a;
    printf ("a:adr:%p,val:%d,b:adr:%p,val:%d\\n",&a,a,&b,b);
    a = 3;
    printf ("a:adr:%p,val:%d,b:adr:%p,val:%d\\n",&a,a,&b,b);
 
}
 
//打印结果：
topeet@ubuntu:~$ gcc test.c
topeet@ubuntu:~$ ./a.out
a:adr:0x7fff343a069c,val:1
b:adr:0x7fff343a0698,val:1
a:adr:0x7fff343a069c,val:3
b:adr:0x7fff343a0698,val:1

1.2 Number 类型转换

var1=3.14
var2=5
var3=int(var1)
var4=float(var2)
 
print(var3,var4)

py内置数学函数

abs(x)    返回数字的绝对值，如abs(-10) 返回 10

math
# ceil(x)    返回数字的上入整数，如math.ceil(4.1) 返回 5
# cmp(x, y)    如果 x < y 返回 -1, 如果 x == y 返回 0, 如果 x > y 返回 1
# exp(x)    返回e的x次幂(ex),如math.exp(1) 返回2.718281828459045
# fabs(x)    返回数字的绝对值，如math.fabs(-10) 返回10.0
# floor(x)    返回数字的下舍整数，如math.floor(4.9)返回 4
# log(x)    如math.log(math.e)返回1.0,math.log(100,10)返回2.0
# log10(x)    返回以10为基数的x的对数，如math.log10(100)返回 2.0
# max(x1, x2,...)    返回给定参数的最大值，参数可以为序列。
# min(x1, x2,...)    返回给定参数的最小值，参数可以为序列。
# modf(x)    返回x的整数部分与小数部分，两部分的数值符号与x相同，整数部分以浮点型表示。
# pow(x, y)    x**y 运算后的值。
# round(x [,n])    返回浮点数x的四舍五入值，如给出n值，则代表舍入到小数点后的位数。
# sqrt(x)    返回数字x的平方根，数字可以为负数，返回类型为实数，如math.sqrt(4)返回 2+0j

二字符串类型（string）

字符串是以单引号\'或双引号"括起来的任意文本，比如\'abc\'，"123"等等。

请注意，\'\'或""本身只是一种表示方式，不是字符串的一部分，因此，字符串\'abc\'只有a，b，c这3个字符。如果\'本身也是一个字符，那就可以用""括起来，比如"I\'m OK"包含的字符是I，\'，m，空格，O，K这6个字符。

2.1 创建字符串：

var1 = \'Hello World!\'
var2 = "Python RAlvin"

对应操作：

# 1   * 重复输出字符串
print(\'hello\'*2)
 
# 2 [] ,[:] 通过索引获取字符串中字符,这里和列表的切片操作是相同的,具体内容见列表
print(\'helloworld\'[2:])
 
# 3 in  成员运算符 - 如果字符串中包含给定的字符返回 True
print(\'el\' in \'hello\')
 
# 4 %   格式字符串
print(\'alex is a good teacher\')
print(\'%s is a good teacher\'%\'alex\')
 
 
# 5 +   字符串拼接
a=\'123\'
b=\'abc\'
c=\'789\'
d1=a+b+c
print(d1)
# +效率低,该用join
d2=\'\'.join([a,b,c])
print(d2)

py字符串的内置方法

# string.capitalize()                                  把字符串的第一个字符大写
# string.center(width)                                 返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
# string.count(str, beg=0, end=len(string))            返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数
# string.decode(encoding=\'UTF-8\', errors=\'strict\')     以 encoding 指定的编码格式解码 string，如果出错默认报一个 ValueError 的 异 常 ， 除 非 errors 指 定 的 是 \'ignore\' 或 者\'replace\'
# string.encode(encoding=\'UTF-8\', errors=\'strict\')     以 encoding 指定的编码格式编码 string，如果出错默认报一个ValueError 的异常，除非 errors 指定的是\'ignore\'或者\'replace\'
# string.endswith(obj, beg=0, end=len(string))         检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，返回 True,否则返回 False.
# string.expandtabs(tabsize=8)                         把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8。
# string.find(str, beg=0, end=len(string))             检测 str 是否包含在 string 中，如果 beg 和 end 指定范围，则检查是否包含在指定范围内，如果是返回开始的索引值，否则返回-1
# string.index(str, beg=0, end=len(string))            跟find()方法一样，只不过如果str不在 string中会报一个异常.
# string.isalnum()                                     如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
# string.isalpha()                                     如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
# string.isdecimal()                                   如果 string 只包含十进制数字则返回 True 否则返回 False.
# string.isdigit()                                     如果 string 只包含数字则返回 True 否则返回 False.
# string.islower()                                     如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
# string.isnumeric()                                   如果 string 中只包含数字字符，则返回 True，否则返回 False
# string.isspace()                                     如果 string 中只包含空格，则返回 True，否则返回 False.
# string.istitle()                                     如果 string 是标题化的(见 title())则返回 True，否则返回 False
# string.isupper()                                     如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
# string.join(seq)                                     以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
# string.ljust(width)                                  返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
# string.lower()                                       转换 string 中所有大写字符为小写.
# string.lstrip()                                      截掉 string 左边的空格
# string.maketrans(intab, outtab])                     maketrans() 方法用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
# max(str)                                             返回字符串 str 中最大的字母。
# min(str)                                             返回字符串 str 中最小的字母。
# string.partition(str)                                有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中不包含str 则 string_pre_str == string.
# string.replace(str1, str2,  num=string.count(str1))  把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
# string.rfind(str, beg=0,end=len(string) )            类似于 find()函数，不过是从右边开始查找.
# string.rindex( str, beg=0,end=len(string))           类似于 index()，不过是从右边开始.
# string.rjust(width)                                  返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
# string.rpartition(str)                               类似于 partition()函数,不过是从右边开始查找.
# string.rstrip()                                      删除 string 字符串末尾的空格.
# string.split(str="", num=string.count(str))          以 str 为分隔符切片 string，如果 num有指定值，则仅分隔 num 个子字符串
# string.splitlines(num=string.count(\'\\n\'))            按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.
# string.startswith(obj, beg=0,end=len(string))        检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查.
# string.strip([obj])                                  在 string 上执行 lstrip()和 rstrip()
# string.swapcase()                                    翻转 string 中的大小写
# string.title()                                       返回"标题化"的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
# string.translate(str, del="")                        根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中
# string.upper()                                       转换 string 中的小写字母为大写

挑几个比较重要的：
capitalize()
swapcase()
title()
upper()
lower()
center()
find()
index()
startswith(obj)
endswith(obj)
strip()
replace(oldstr, newstr)
isalpha()
isdigit()
format()
count()

一些区别

num = "1"  #unicode
num.isdigit()   # True
num.isdecimal() # True
num.isnumeric() # True

num = "1" # 全角
num.isdigit()   # True
num.isdecimal() # True
num.isnumeric() # True

num = b"1" # byte
num.isdigit()   # True
num.isdecimal() # AttributeError \'bytes\' object has no attribute \'isdecimal\'
num.isnumeric() # AttributeError \'bytes\' object has no attribute \'isnumeric\'

num = "IV" # 罗马数字
num.isdigit()   # True
num.isdecimal() # False
num.isnumeric() # True

num = "四" # 汉字
num.isdigit()   # False
num.isdecimal() # False
num.isnumeric() # True

===================
isdigit()
True: Unicode数字，byte数字（单字节），全角数字（双字节），罗马数字
False: 汉字数字
Error: 无

isdecimal()
True: Unicode数字，，全角数字（双字节）
False: 罗马数字，汉字数字
Error: byte数字（单字节）

isnumeric()
True: Unicode数字，全角数字（双字节），罗马数字，汉字数字
False: 无
Error: byte数字（单字节）

三字节类型(bytes)

# a=bytes(\'hello\',\'utf8\')
# a=bytes(\'中国\',\'utf8\')
 
 
a=bytes(\'中国\',\'utf8\')
b=bytes(\'hello\',\'gbk\')
str(a,"utf8");
#
print(a)        #b\'\\xe4\\xb8\\xad\\xe5\\x9b\\xbd\'
print(ord(\'h\')) #其十进制 unicode 值为: 104
print(ord(\'中\'))#其十进制 unicode 值为:20013
print(chr(104)) # 值为 h
print(chr(20013)) #值为 中

#  h   e  l   l   o
# 104 101 108 108 111   编码后结果:与ASCII表对应
 
 
#     中                国
#   \\xd6\\xd0         \\xb9\\xfa       gbk编码后的字节结果
#\\xe4 \\xb8 \\xad   \\xe5 \\x9b \\xbd    utf8编码后的字节结果
# 228 184 173      229 155  189        a[:]切片取
 
 
c=a.decode(\'utf8\') 解码
d=b.decode(\'gbk\')
#b=a.decode(\'gbk\') :很明显报错
# = #.encoding(\'utf8\') 编码

print(c) #中国
print(d) #hello

注意：对于 ASCII 字符串，因为无论哪种编码对应的结果都是一样的，所以可以直接使用 b\'xxxx\' 赋值创建 bytes 实例，但对于非 ASCII 编码的字符则不能通过这种方式创建 bytes 实例，需要指明编码方式。

b1=b\'123\'
print(type(b1))
# b2=b\'中国\' #报错
# 所以得这样:
b2=bytes(\'中国\',\'utf8\')
print(b2)#b\'\\xe4\\xb8\\xad\\xe5\\x9b\\xbd\'

四布尔值

一个布尔值只有True、False两种值，要么是True，要么是False，在Python中，可以直接用True、False表示布尔值（请注意大小写）

print(True)
print(4>2)
print(bool([3,4]))
print(True+1)

与或非操作：

bool(1 and 0)
bool(1 and 1)
bool(1 or 0)
bool(not 0)

布尔值经常用在条件判断中:

age=18
if age>18:#bool(age>18)
    print(\'old\')
else:
    print(\'young\')

五 List（列表）

列表（list）是Python以及其他语言中最常用到的数据结构之一。Python使用使用中括号 [ ] 来解析列表。列表是可变的（mutable）——可以改变列表的内容。

1 查（［］）

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']
 
# print(names_class2[2])        王五
# print(names_class2[0:3])      [\'张三\', \'李四\', \'王五\']
# print(names_class2[0:7])      [\'张三\', \'李四\', \'王五\', \'赵六\']
# print(names_class2[-1])       赵六
# print(names_class2[2:3])      [\'王五\']
# print(names_class2[0:3:1])    [\'张三\', \'李四\', \'王五\']
# print(names_class2[3:0:-1])   [\'赵六\', \'王五\', \'李四\']
# print(names_class2[:])　       [\'张三\', \'李四\', \'王五\', \'赵六\']

2 增（append，insert）

insert 方法用于将对象插入到列表中，而append方法则用于在列表末尾追加新的对象

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']

names_class2.append(\'alex\')
names_class2.insert(2,\'alvin\')
print(names_class2)

>>> [\'张三\', \'李四\', \'alvin\', \'王五\', \'赵六\', \'alex\']

3 改（重新赋值）

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']
 
names_class2[3]=\'赵七\'
names_class2[0:2]=[\'wusir\',\'alvin\']
print(names_class2)

>>>  [\'wusir\', \'alvin\', \'王五\', \'赵七\']

4 删（remove，del，pop）

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']

# names_class2.remove(\'李四\') # 删除李四
# del names_class2[0]　　　　　　　　 # 删除[0]处数据
# del names_class2 # 删除 names_class2 ，再 print(names_class2) 会报错，提示 names_class2 没有定义
# names_class2.pop()#注意,pop是有一个返回值的　
name = names_class2.pop(2) # 也可以加数字，也有返回值
print(names_class2)
print(name)

print(names_class2.clear())   # 清空列表

>>>
[\'张三\', \'李四\', \'赵六\']
王五

5 其他操作

5.1 count

count 方法统计某个元素在列表中出现的次数：

>>> [\'to\', \'be\', \'or\', \'not\', \'to\', \'be\'].count(\'to\') 
2 
>>> x = [[1,2], 1, 1, [2, 1, [1, 2]]] 
>>> x.count(1) 
2 
>>> x.count([1,2]) 
1

5.2 extend

extend 方法可以在列表的末尾一次性追加另一个序列中的多个值。

>>> a = [1, 2, 3] 
>>> b = [4, 5, 6] 
>>> a.extend(b) 
>>> a 
[1, 2, 3, 4, 5, 6]

extend 方法修改了被扩展的列表，而原始的连接操作（+）则不然，它会返回一个全新的列表。

>>> a = [1, 2, 3] 
>>> b = [4, 5, 6] 
>>> a.extend(b) 
>>> a 
[1, 2, 3, 4, 5, 6] 
>>> 
>>> a + b 
[1, 2, 3, 4, 5, 6, 4, 5, 6] 
>>> a 
[1, 2, 3, 4, 5, 6]

5.3 index

index 方法用于从列表中找出某个值第一个匹配项的索引位置：

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']

num = names_class2.index(\'李四\')
print(num)

>>>  1

5.4 reverse

reverse 方法将列表中的元素反向存放。

names_class2=[\'张三\',\'李四\',\'王五\',\'赵六\']

names_class2.reverse()
print(names_class2)

>>>  [\'赵六\', \'王五\', \'李四\', \'张三\']

5.5 sort

sort 方法用于在原位置对列表进行排序。

x = [4, 6, 2, 1, 7, 9]
x.sort()#x.sort(reverse=True)
print(x)
>>>  [1, 2, 4, 6, 7, 9]

5.6 深浅拷贝copy

现在，大家先不要理会什么是深浅拷贝，听我说，对于一个列表，我想复制一份怎么办呢？

肯定会有同学说，重新赋值呗：

names_class1=[\'张三\',\'李四\',\'王五\',\'赵六\']
names_class1_copy=[\'张三\',\'李四\',\'王五\',\'赵六\']

这是两块独立的内存空间

这也没问题，还是那句话，如果列表内容做够大，你真的可以要每一个元素都重新写一遍吗？当然不啦，所以列表里为我们内置了copy方法：

names_class1=[\'张三\',\'李四\',\'王五\',\'赵六\',[1,2,3]]
names_class1_copy=names_class1.copy()
 
names_class1[0]=\'zhangsan\'
print(names_class1)
print(names_class1_copy)
 
############
names_class1[4][2]=5
print(names_class1)
print(names_class1_copy)
 
#问题来了,为什么names_class1_copy跟随改动了最后的列表,从这一点我们可以断定,这两个变量并不是完全独立的,那他们的关系是什么呢?为什么有的改变,有的不改变呢?

这里就涉及到我们要讲的深浅拷贝了：

#不可变数据类型:数字,字符串,元组         可变类型:列表,字典
 
# l=[2,2,3]
# print(id(l))
# l[0]=5
# print(id(l))   # 当你对可变类型进行修改时,比如这个列表对象l,它的内存地址不会变化,注意是这个列表对象l,不是它里面的元素
#                # this is the most important
#
# s=\'alex\'
# print(id(s))   #像字符串,列表,数字这些不可变数据类型,,是不能修改的,比如我想要一个\'Alex\'的字符串,只能重新创建一个\'Alex\'的对象,然后让指针只想这个新对象
#
# s[0]=\'e\'       #报错
# print(id(s))
 
#重点:浅拷贝
a=[[1,2],3,4]
b=a[:]#b=a.copy()
 
print(a,b)
print(id(a),id(b))
print(\'*************\')
print(\'a[0]:\',id(a[0]),\'b[0]:\',id(b[0]))
print(\'a[0][0]:\',id(a[0][0]),\'b[0][0]:\',id(b[0][0]))
print(\'a[0][1]:\',id(a[0][1]),\'b[0][1]:\',id(b[0][1]))
print(\'a[1]:\',id(a[1]),\'b[1]:\',id(b[1]))
print(\'a[2]:\',id(a[2]),\'b[2]:\',id(b[2]))
 
 
print(\'___________________________________________\')
b[0][0]=8
 
print(a,b)
print(id(a),id(b))
print(\'*************\')
print(\'a[0]:\',id(a[0]),\'b[0]:\',id(b[0]))
print(\'a[0][0]:\',id(a[0][0]),\'b[0][0]:\',id(b[0][0]))
print(\'a[0][1]:\',id(a[0][1]),\'b[0][1]:\',id(b[0][1]))
print(\'a[1]:\',id(a[1]),\'b[1]:\',id(b[1]))
print(\'a[2]:\',id(a[2]),\'b[2]:\',id(b[2]))<br><br><br>#outcome

# [[1, 2], 3, 4] [[1, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375104 b[0][0]: 4297375104
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200
# ___________________________________________
# [[8, 2], 3, 4] [[8, 2], 3, 4]
# 4331943624 4331943752
# *************
# a[0]: 4331611144 b[0]: 4331611144
# a[0][0]: 4297375328 b[0][0]: 4297375328
# a[0][1]: 4297375136 b[0][1]: 4297375136
# a[1]: 4297375168 b[1]: 4297375168
# a[2]: 4297375200 b[2]: 4297375200

那么怎么解释这样的一个结果呢？

补充

b,*c=[1,2,3,4,5]
print(b)
print(c)

>>>
1
[2, 3, 4, 5]

深拷贝

import copy
origin = [1, 2, [3, 4]]
#origin 里边有三个元素：1， 2，[3, 4]
cop1 = copy.copy(origin)
cop2 = copy.deepcopy(origin)

六 tuple（元组）

元组被称为只读列表，即数据可以被查询(count/index)，但不能被修改，所以，列表的切片操作同样适用于元组。

元组写在小括号(())里，元素之间用逗号隔开。

虽然tuple的元素不可改变，但它可以包含可变的对象，比如list列表。

构造包含 0 个或 1 个元素的元组比较特殊，所以有一些额外的语法规则：

tup1 = ()    # 空元组
tup2 = (20,) # 一个元素，需要在元素后添加逗号

作用：

1 对于一些数据我们不想被修改，可以使用元组；

2 另外，元组的意义还在于，元组可以在映射（和集合的成员）中当作键使用——而列表则不行；元组作为很多内建函数和方法的返回值存在。

七 Dictionary（字典）

字典是python中唯一的映射类型，采用键值对（key-value）的形式存储数据。python对key进行哈希函数运算，根据计算的结果决定value的存储地址，所以字典是无序存储的，且key必须是可哈希的。可哈希表示key必须是不可变类型，如：数字、字符串、元组。

字典(dictionary)是除列表意外python之中最灵活的内置数据结构类型。列表是有序的对象结合，字典是无序的对象集合。两者之间的区别在于：字典当中的元素是通过键来存取的，而不是通过偏移存取。

创建字典：

dic1={\'name\':\'alex\',\'age\':36,\'sex\':\'male\'}
dic2=dict([(\'name\',\'alex\'),("age",36)])
dic3=dict(((\'name\',\'alex\'),("age",36)))
print(dic1)
print(dic2)
print(dic3)

1 增

dic3={}
 
dic3[\'name\']=\'alex\'
dic3[\'age\']=18
print(dic3)#{\'name\': \'alex\', \'age\': 18}

# setdefault() 函数和 get 方法类似, 如果键不存在于字典中，将会添加键并将值设为默认值。
a=dic3.setdefault(\'name\',\'yuan\')  # 因为 name键 存在，所以返回 值 alex
b=dic3.setdefault(\'ages\',22)      # 因为 ages 键不存在，所以设置 键值对，且返回 22
print(a,b)
print(dic3)

>>>

{\'name\': \'alex\', \'age\': 18}
alex 22
{\'name\': \'alex\', \'age\': 18, \'ages\': 22}

2 查

dic3={\'name\': \'alex\', \'age\': 18}
 
# print(dic3[\'name\'])
# print(dic3[\'names\'])    # names 键不存在，直接报错。
#
# print(dic3.get(\'age\',False))
# print(dic3.get(\'ages\',False))   # 由于使用 get ，所以就算 ages不存在，也不会报错，返回 false
 
print(dic3.items())
print(dic3.keys())
print(dic3.values())
 
print(\'name\' in dic3)# py2:  dic3.has_key(\'name\')
print(list(dic3.values()))

>>>
dict_items([(\'name\', \'alex\'), (\'age\', 18)])
dict_keys([\'name\', \'age\'Python学习之旅---数据类型（数字字符窜列表元组字典布尔值）
 python基础教程-数据类型详解
 python基础（八种数据类型）
 python基础04--基本数据类型（列表元组字典）
 学Python，这些内置数据类型总结（数字类型）你可否知道
 python基本数据类型