python常见数据类型

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python常见数据类型相关的知识,希望对你有一定的参考价值。

一,python整数类型所表示的数据。

1,一般用以表示一类数值:所有正整数,0和负整数;

2,整型作为最常用的,频繁参与计算的数据类型,在python3.5中解释器会自动在内存中创建-5-3000之间的(包含5,不包含3000)整型对象,也就是说在该范围内,相等都是同一个已经创建好的整型对象。范围之外的即使相等也表示不同对象,该特性随python版本而改变,不要过于依赖。

3,bool型继承了int型,他是int的子类。

4,Python2中有长整型long,数值范围更大,在python3中已取消,所有整型统一由int表示。

5,参与所有数值计算,数学运算,科学计算。这也是所有编程语言都有的数据类型,因为编程语言生而需要模拟人的思维,借助数学方式,自动计算、更好的解决大量重复性的事务,因此数值类型、整数类型在编程语言中不可或缺。

6,支持二进制(0b\\0B开头),十进制,八进制(0o\\0O),十六进制(0x\\0X)

二,python整数和浮点型支持常规的数值运算

整数和浮点数都可参与的运算:+ - * / %(取余) //(整除) **(幂)

Python字符型:

python字符型表示的数据:
python3支持Unicode编码,由字母、数字和符号组成的形式就叫字符串,更接近或者相同与人们文字符号表示,因此在信息表示和传递时它也是最受认可的形式。在程序编写中也是非常常用,对应的可操作的方法也很多,很有意思。
字符串不可被修改,可以拼接等方法创建新字符串对象;
支持分片和下标操作;a[2:]
支持+拼接,*重复操作和成员关系in/not in;
表示形式:用单引号双引号包含起来的符号;a = str(‘sdfsdfsdf’) 或 r’\\t\\nabcd’ 原始字符,Bytes:b’abcd’;
6,字符串属于不可变数据类型,内部机制为了节省空间,相同的两个字符串表示相同的一个对象。a = ‘python’ b = ‘python’ a is b :True

二, 字符串支持的运算方法

1,capitalize() :首字母大写后边的字母小写 a = ‘abcd’ b = a.capitalize() b:Abcd

2,casefold() lower():字母转换为全小写

3,center(width,fillchar) :居中,width填补的长度;fillchar添加的字符

a = a.center(10,’_’) //’____abcd____’ 默认无fillchar填充空格

4,count(sub,star,end) :字母计数:sub要查询的字符

5,encode(encoding=’utf-8’,errors=’strict’) 设置编码

Errors :设置错误类型

6,endswith(suffix,star,end) : 若以suffix结尾返回True

7,expandtabs(8) :设置字符串中tab按键符的空格长度:’\\tabcde’

8,find(sub,star,end) : 返回指定范围内的字符串下标,未找到返回-1

9,index(sub,star,end) :返回指定范围字符串下标未找到抛出异常

10,isalnum() :判断字符串是否是字母或数字,或字母和数字组合

11,isalpha() :判断是否全是字母

12,isdecimal() :判断字符串是否是十进制数值

13,isdigit() :判断字符串是否是数字

14,isidentifier() :判断字符串中是否包含关键字

15,islower() :判断是否全小写

16,isnumeric() :判断全是数字

17,isspace() :判断是否是空格

18,isupper() 判断是否大写

19,istitle() :判断是否首字母大写

20,join(iterable) :把可迭代对象用字符串进行分割:a.join(‘123’)

21,ljust(width,fillchar);rjust() :左对齐右对齐

22, upper() :将字符串改为大写

23,split(sep=None,maxsplit=-1) :分割一个字符串,被选中字符在字符串中删除

‘ab1cd1efg’.split(‘1’) :[‘ab’,’cd’,’efg’]

三,字符串格式化:按照规格输出字符串

format(*args,**kwargs) :args位置参数,kwargs关键字参数

‘0:.1f’.format(123.468) :格式化参数,小数点后保留1位四舍五入

四,字符串操作符%

1,%s :格式化字符串 ‘abcd%sdef’%’dddd’

2,%d:格式化整数

3,%o格式化无符号八进制

4,%x格式化无符号十六进制

5,%f格式化定点数

6, %e: 科学计数法格式化定点数

7,%g 根据值大小自动选%f,%e

8, %G E X :大写形式

五,格式化辅助命令:

m.n :m最小总宽度,n小数点后位数:’%12.4f’%23456.789

六,转义字符:字符串前r避免转义:r’\\nhello\\thi’

\\n:换行符

\\t:横向制表符

\\\':\'

\\":"

\\b:退格符

\\r:回车

\\v:纵向制表符

\\f:换页符

\\o,\\x:八进制和十六进制

\\0:空字符串

Python列表list

一,Python的列表list类型表示的数据:

Python列表在cpython中被解释为长度可变的数组,用其他对象组成的连续数组。

列表中元素可以是相同或不同的数据类型;
当列表元素增加或删除时,列表对象自动进行扩展或收缩内存,保证元素之间没有缝隙,总是连续的。
Python中的列表是一个序列,也是一个容器类型
创建列表:a = []; b = [1,’python’]; c = list(); d = list((1,3,4,5))
支持切片操作list[start,stop,step]
python列表常用方法
1,append添加单个元素:list.append(object); //a.append(‘python’)

2,extend添加可迭代对象: list.extend(iterable); //a.extend(‘abcde’/[1,2,3])

3,insert 插入元素:list.insert(index,object): 在index下标前插入元素//a.insert(2,’python’)

4,clear 清空所有元素:list.clear() //a.clear()

5,pop 删除并返回一个元素:list.pop(index) //默认删除默认一个元素

remove 删除指定元素:list.remove(v) ,v元素不存在报错 //a.remove(‘c’)
7,count 返回这个值在列表中数量:list.count(value)

8,copy 浅拷贝一个新列表:list.copy()

9,sort:排序list.sort(reverse=False/True) :默认升序

排序函数:sorted(list)

10,reverse: 原地翻转:list.reverse()

11,index(value,star,stop) :指定范围内该值下标:list.index(2,0,5)

列表元素访问:
下标访问:list[1]
For循环遍历
通过下标修改元素:list[2 ] = ‘hello’
列表常用运算符:
1,比较运算符:从第一个元素开始对比

2,+ 拼接一个新列表:l1+ l2

3, 重复操作符:* ,多个列表拼接

成员关系操作符:in/ not in
逻辑运算符:and not or
列表常用的排序方法:
冒泡排序;选择排序;快速排序;归并排序

Python元组tuple

一,Python元组tuple数据类型表示的数据:

元组是受到限制的、不可改变的列表;
可以是同构也可以是异构;
元组是序列类型、是可迭代对象,是容器类型。
元组的创建: a = (1,2,3)或a=1,2,3; b = tuple(); c = tuple(iterable)
支持切片操作tuple[start,stop,step]

二,python元组常用方法

1,index(value,star,stop) :指定范围内该值下标:tuple.index(2,0,5)

2,count(value) :值出现次数

三,支持运算:

1,比较运算符:从第一个元素开始对比

2,+ 拼接一个新元组:l1+ l2

3, 重复操作符:* ,多个元组拼接

4成员关系操作符:in/ not in

逻辑运算符:and not or
四,元组的访问

下标操作;
For循环遍历访问。

Python字典类型

一,Python字典dict表示的数据:key:value

可根据关键字:键快速索引到对应的值;
字典是映射类型,键值对一一对应关系,不是序列;
字典元素是无序的;
字典是可迭代对象,是容器类型;
字典的创建:k = ; k1=‘keyword’:object; k2 = dict();
K3 = dict(mapping); dict=(iterable)

二,字典的访问:

通过key:k[‘key’]

修改key对应的值:K[‘key’] = value

For循环遍历出来的是key;

For循环键值对:for I in d.items():

For 循环enumerate: for k,v in enumerate(k1):

In/not in 成员关系查询键不支持查值

三,字典常用方法

get(key,de):获取值:k.get(key,de) //若不存在则默认输出de
pop(k,de):删除一个键值对,不存在输出de,未设置报错;
keys() :返回字典所有key组成的序列:list(k.keys()) [1,2,3];
values():返回字典所有value组成的序列:list(k.values())
items():返回键值对组成的元组为元素的序列:(类set)list(k.items())
update(e):更新字典:e可是字典或两元素组成的单位元素序列:e=[(5,6),(7,8)];
k.update(e)

clear():清空字典;
popitem()删除某个键值对,若字典为空则报错
copy() :浅拷贝
10, fromkeys(iterable,value=None):从可迭代对象创建字典

.fromkeys([1,2,3]) -----1:None,2:None,3:None

11,setdefault(k,d=None) :若key不存在则生成一个键值对

k.setdefault(‘keyword’)

Python 集合set

集合表示的数据:
多个元素的无序组合,集合是无序的,集合元素是唯一的;
字典的键是由集合实现的;
集合是可迭代对象
集合创建:s = 1,2; s1 = set(); s2 = set(iterable)
集合元素的访问:
For 循环将集合所有元素全部访问一遍,不重复

常用方法:
add(object):s.add(‘hi’) 向集合添加一个元素
pop() :弹栈,集合为空则报错:删除任意一个元素;
clear():清空集合,返回一个空集合对象;
remove(object):删除一个元素,不存在和报错:s.remove(‘hi’)
update(集合):更新另一个集合,元素不存在则不更新;
copy() :浅拷贝
集合的运算:
交集:s1&s2;
差集,补集:s1-s2;
并集:s1|s2;
Issubset():判断是否是子集:s1.issubset(s2) s1是否s2的集合子集
Issuperset():判断是否是父集:s1.issuperset()
不可变集合:
Frozenset():返回一个空的不可变集合对象

Frozenset(iterable):

S = frozenset(iterable)

Python序列类型共同特性

一,序列类型共同特性

python序列类型有:str字符串,list列表,tuple元组
都支持下标索引,切片操作;
下标都是从0开始,都可通过下标进行访问;
拥有相同的操作符
二,支持的函数:

len(obj):返回对象长度;
list(iterable):将可迭代对象转为列表;
tuple(iterable):将可迭代对象转为元组;
str(ojb):将任何对象转为字符串形式;
max(iterable): python3中元素要是同类型,python2中元素可异构:max([‘a’,1])
min(iterable):和max类似;
sum(iterable,star=0),求可迭代对象和,默认star为0,元素不能为字符串
sorted(iterable,key=None,reverse=False)
s=[(‘a’,3),(‘b’,2),(‘c’,9)]

sorted(s,key=lambda s:s[1]) //按照数字排序

reversed(sequence):翻转序列,返回迭代器
enumerate(iterable):返回enumerate对象,其元素都是一个元组(下标,值)
zip(iter1,iter2): zip([1,2],[3,4]) ----[(1,3),(2,4)]

序列类型的切片操作:

Slice:

L[index]; 访问某个元素;

L[1:4]; 区间

L[star:stop:step]; 设置步长取区间元素
参考技术A 1. 数字类型
int(整型):在32位机器上,整数的位数是32位,取值范围是-231~231-1,即-2147483648~214748364;在64位系统上,整数的位数为64位,取值范围为-263~263-1,即9223372036854775808~9223372036854775807。
long(长整型):Python长整型没有指定位宽,但是由于机器内存有限,使用长的长整数数值也不可能无限大。
float(浮点型):浮点型也就是带有小数点的数,其精度和机器有关。
complex(复数):Python还支持复数,复数由实数部分和虚数部分构成,可以用 a + bj,或者 complex(a,b) 表示, 复数的实部 a
和虚部 b 都是浮点型。
2. 字符串
在Python中,加了引号的字符都被认为是字符串,其声明有三种方式,分别是:单引号、双引号和三引号;Python中的字符串有两种数据类型,分别是str类型和unicode类型,str类型采用的ASCII编码,无法表示中文,unicode类型采用unicode编码,能够表示任意字符,包括中文和其他语言。
3. 布尔型
和其他编程语言一样,Python布尔类型也是用于逻辑运算,有两个值:True(真)和False(假)。
4. 列表
列表是Python中使用最频繁的数据类型,集合中可以放任何数据类型,可对集合进行创建、查找、切片、增加、修改、删除、循环和排序操作。
5. 元组
元组和列表一样,也是一种序列,与列表不同的是,元组是不可修改的,元组用”()”标识,内部元素用逗号隔开。
6. 字典
字典是一种键值对的集合,是除列表以外Python之中最灵活的内置数据结构类型,列表是有序的对象集合,字典是无序的对象集合。
7. 集合
集合是一个无序的、不重复的数据组合,它的主要作用有两个,分别是去重和关系测试。

python笔记——常见数据类型及注意点

整数类型int

十进制 → 默认的进制
二进制 → 以0b开头(数字0和小写字母b)
八进制 → 以0o开头(数字0和小写字母o)
十六进制 → 0x开头(数字0和小写字母x)

进制基本数逢几进一表示形式
十进制0,1,2,3,4,5,6,7,8,910118
二进制0,120b1110110
八进制0,1,2,3,4,5,6,780o166
十六进制0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F160x76

浮点类型

浮点数由整数部分和小数部分构成,涉及小数部分会有一个问题,因为计算机使用二进制表示,那么在表示小数的时候就会有点误差,导致浮点数存储不精确
如:

print(1.1+2.2)  #3.30000000003
print(1.1+2.1)  #3.2

可以看到1.1+2.2的结果有一个极小误差,这个问题可以通过导入模块decimal进行解决

from decimal import Decimal
print(Decimal(1.1)+Decimal(2.2))  #3.3

布尔类型

布尔是boolean的简写bool的谐音
True为真,False为假
与其他语言不同的是,python布尔类型可以转成整数进行计算,其中True可以表示1,False可以表示0

print(True+1)  #2
print(False+1) #1

字符串类型

一、定义

字符串可以使用单引号’ ‘、双引号" "、三引号’’’ ‘’'或""" “”"来定义,区别在于单引号和双引号定义的字符串必须在一行中显示,而三引号定义的字符串可以显示在连续的多行。

str1 = '人生苦短,我用python'
str2 = "人生苦短,我用python"
str3 = '''人生苦短,
我用python'''

二、驻留机制

字符串又被称为不可变的字符序列(同为不可变序列的还有元组),这涉及到了字符串的驻留机制
1、驻留机制即“仅保存一份相同且不可变字符串的方法”,不同的值被存放在字符串的驻留池中,Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量
在这里插入图片描述
可以看到,无论先后以何种方式创建相同的字符串,都是把驻留池中的该字符串赋给各变量。

a = 'python'
b = "python"
c = '''python'''

print(id(a)) #1874508798960
print(id(b)) #1874508798960
print(id(c)) #1874508798960

2、什么样的字符串会有驻留机制?(仅限于交互模式)

  • 字符串的长度为0或1时(即便带有非标识符)
s1 = ''
s2 = ''
print(s1 is s2) #True

str1 =%‘
str2 = '%'
print(str1 is str2) #True
  • 全是符号标识符的字符串
s1 = 'abc%'
s2 = 'abc%'
print(s1 == s2) #True
print(s1 is s2) #False

str1 = ’abcx‘
str2 = 'abcx'
print(str1 is str2) #True
  • 字符串只在编译时驻留,而非运行时
s1 = 'abc'
s2 = 'ab+c'
s3 = ''.join(['ab' , 'c'])

print(s1)   #abc
print(s2)   #abc
print(s3)   #abc

print(type(s1))   #<class 'str'>
print(type(s2))   #<class 'str'>
print(type(s3))   #<class 'str'>

print(s1 is s2)   #True
print(s1 is s3)   #False

这里s1与s3的地址不同的原因在于s1的赋值和s2的字符串拼接是在运行前完成的,而".join"方法是在运行时执行的,在程序运行期间会开辟新的空间去存储abc的值。

  • [-5, 256]之间的整数数字
s1 = -5
s2 = -5'
print(s1 is s2) #True

str1 = -6
str2 = -6
print(str1 is str2) #False

3、强制驻留

  • 当然,python中可以用sys中的intern方法强制2个字符串指向同一个对象,也就是强制字符串驻留,两个变量指向同一个空间。
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #False

s1 = sys.intern(s2)
print(s1 is s2)   #True

4、为什么上面说这些情况只给予交互模式,那么pycharm中呢?其实pycharm对字符串进行了优化处理,原本不驻留的情况在pycharm中却是驻留的

#pycharm环境下:
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #True

5、字符串驻留机制的优缺点

  • 当需要值相同的字符串时,可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。
  • 在需要进行字符串拼接时建议使用str类型的join方法,而非+,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比"+”高。

三、字符串的常用操作

1、查询

  • 注意索引是从0开始
方法名称作用
index()查找子串substr第一次出现的位置,如果查找的子串不存在时,则抛出ValueError
rindex()查找子串substr最后一次出现的位置,如果查找的子串不存在时,则抛出ValueError
find()查找子串substr第一次出现的位置,如果查找的子串不存在时,则返回-1
rfind()查找子串substr最后一次出现的位置,如果查找的子串不存在时,则返回-1

2、大小写转换

  • 注意转换大小写后,一定会产生一个新的字符串对象,即便转换前后的字符串内容是一样的(不可驻留)
方法名称作用
upper()把字符串中所有字符都转成大写字母
lower()把字符串中所有字符都转成小写字母
swapcase()把字符串中所有大写字母转成小写字母,把所有小写字母都转成大写字母
capitalize()把第一个字符转换为大写,把其余字符转换为小写
title()把每个单词的第一个字符转换为大写,把每个单词的剩余字符转换为小写

3、对齐

  • 居中对齐往两边填充,左对齐往右边填充,右对齐往左边填充
s = 'Hello,Python'  #十二个字符
#宽度设置为20,会把字符串延长至20个字符,也就是多了八个,这八个位置用*填充,将字符串s居中。
print(s.center(20,'*'))   #****Hello,Python****
print(s.ljust(20,'*'))   #Hello,Python********
print(s.rjust(20,'*'))   #********Hello,Python
  • 需要注意的是当字符串首位是’+‘或’-‘时zfill会将’+‘或’-'置于首位,并作为扩充字符。
print('-8910',zfill(8))   #-0008910
方法名称作用
center()居中对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
ljust()左对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
rjust()右对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
zfill()右对齐,左边用0填充,该方法只接收一个参数,用于指定字符串的宽度,如果指定的宽度小于等于字符串的长度,返回字符串本身

4、劈分

  • split()和rsplit()只有当指定最大分割次数maxsplit时才有区别。
方法名称作用
split()从字符串的左边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表
以参数sep指定劈分字符串的劈分符
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分
rsplit()从字符串的右边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表
以参数sep指定劈分字符串的劈分符
通过参数naxsp1it指定劳分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分

5、判断

  • 注意isalpha()和isalnum判断字符串时,中文也认为是字母
print('张三'.isalpha())   #True
print('张三123'.isalnum())   #True
  • isdecimal()和isnumeric()的区别
print('123'.isdecimal())   #True
print('123四'.isdecimal())   #False
print('ⅡⅠ'.isdecimal())   #False

print('123'.isnumeric())   #True
print('123四'.isnumeric())   #True
print('ⅡⅠ'.isnumeric())   #True
方法名称作用
isidentifier()判断指定的字符串是不是合法的标识符
isspace()判断指定的字符串是否全部由空白字符组成(回车、换行,水平制表符)
isalpha()判断指定的字符串是否全部由字母组成
isdecimal()判断指定字符串是否全部由十进制的数字组成
isnumeric判断指定的字符串是否全部由数字组成
isalnum判断指定字符串是否全部由字母和数字组成

6、替换与合并

功能方法名称作用
字符串替换replace()第1个参数指定被替换的子串,第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串,替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数
字符串的合并join()将列表或元组中的字符串合并成一个字符串

7、比较

  • 运算符:>,>=,<,<=,==(比较value),!=,is(比较id)
  • 比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较
  • 比较原理:两上字符进行比较时,比较的是其ordinal value(即原始值,或者说Unicode编码),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符

8、切片

  • 字符串是不可变类型,不具备增、删、改等操作
  • 切片操作将产生新的对象
  • [start : end : step]为左闭右开,step默认为1,不定义start则从0开始,不定义end则到字符串的最后一个元素(-1)。step也可以为负数,如[ : : -1]默认从字符串的最后一个元素开始,到字符串的第一个元素结束

9、格式化
字符串的格式化也可以用拼接完成,但拼接占用内存大,所以一般还是有格式化。

  • 三种常用的格式化方法
name = '张三'
age = 20
#(1)%占位符 %s为字符串,%d为整数,%f为浮点数
print('我叫%s,今年%d岁' % (name, age))  #我叫张三,今年20岁

#(2){}.format
print('我叫{0},今年{1}岁,我真的叫{0}'.format(name, age))  #我叫张三,今年20岁,我真的叫张三

#(3)f-string
print(f'我叫{name},今年{age}岁')  #我叫张三,今年20岁
  • 宽度、精度的表示可以用占位符或{}
#10表示宽度为10(前面空8位)
print('%10d' % 99)  #        10
#.3表示保留三位小数
print('%.3f' % 3.1415926)   #3.142
#同时表示宽度和精度(前面空5位)
print('%10.3f' % 3.1415926)   #     3.142
#0表示第一个占位符,.3表示一共显示三位数
print('{0:.3}'.format(3.1415926))   #3.14
#.3f表示一共显示三位小数
print('{0:.3f}'.format(3.1415926))   #3.142
#10.3f表示一共显示10位,其中三位是小数(前面5个空格)
print('{0:10.3f}'.format(3.1415926))   #     3.142

10、编码与解码
编码的原因是计算机之间的数据传输是基于二进制数据。

  • 编码:将字符串转换为二进制数据(bytes)
    str.encode(encoding=‘UTF-8’)
  • 解码:将bytes类型的数据转换为字符串类型
    byte.decode(encoding=‘UTF-8’)
  • 需要注意的是编码和解码用的编码格式要相同,如编码时用的UTF-8,解码时也要用UTF-8

数据类型转换

函数名作用注意事项举例
str()将其他数据类型转成字符串也可用引号转换str(123);‘123’
int()将其他数据类型转成整数1、文字类和带小数类字符串无法转换成整数 2、浮点数转化为整数:抹零取整int(‘123’);int(9.8)
float()将其他数据类型转成浮点数1、文字类无法转换成浮点数 2、整数转成浮点数,末尾为.0float(‘9.9’);float(9)

在这里插入图片描述

以上是关于python常见数据类型的主要内容,如果未能解决你的问题,请参考以下文章

Python常见数据类型

DAY 001--python常见7种数据类型

Python常见数据类型及操作

Python中常见的数据类型总结

Python之基本数据类型及其常见方法

Python认知篇:常见数据类型--字符串+元组