python笔记——常见数据类型及注意点
Posted LeoJarvis
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python笔记——常见数据类型及注意点相关的知识,希望对你有一定的参考价值。
整数类型int
十进制 → 默认的进制
二进制 → 以0b开头(数字0和小写字母b)
八进制 → 以0o开头(数字0和小写字母o)
十六进制 → 0x开头(数字0和小写字母x)
进制 | 基本数 | 逢几进一 | 表示形式 |
---|---|---|---|
十进制 | 0,1,2,3,4,5,6,7,8,9 | 10 | 118 |
二进制 | 0,1 | 2 | 0b1110110 |
八进制 | 0,1,2,3,4,5,6,7 | 8 | 0o166 |
十六进制 | 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F | 16 | 0x76 |
浮点类型
浮点数由整数部分和小数部分构成,涉及小数部分会有一个问题,因为计算机使用二进制表示,那么在表示小数的时候就会有点误差,导致浮点数存储不精确
如:
print(1.1+2.2) #3.30000000003
print(1.1+2.1) #3.2
可以看到1.1+2.2的结果有一个极小误差,这个问题可以通过导入模块decimal进行解决
from decimal import Decimal
print(Decimal(1.1)+Decimal(2.2)) #3.3
布尔类型
布尔是boolean的简写bool的谐音
True为真,False为假
与其他语言不同的是,python布尔类型可以转成整数进行计算,其中True可以表示1,False可以表示0
print(True+1) #2
print(False+1) #1
字符串类型
一、定义
字符串可以使用单引号’ ‘、双引号" "、三引号’’’ ‘’'或""" “”"来定义,区别在于单引号和双引号定义的字符串必须在一行中显示,而三引号定义的字符串可以显示在连续的多行。
str1 = '人生苦短,我用python'
str2 = "人生苦短,我用python"
str3 = '''人生苦短,
我用python'''
二、驻留机制
字符串又被称为不可变的字符序列(同为不可变序列的还有元组),这涉及到了字符串的驻留机制
1、驻留机制即“仅保存一份相同且不可变字符串的方法”,不同的值被存放在字符串的驻留池中,Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量
可以看到,无论先后以何种方式创建相同的字符串,都是把驻留池中的该字符串赋给各变量。
a = 'python'
b = "python"
c = '''python'''
print(id(a)) #1874508798960
print(id(b)) #1874508798960
print(id(c)) #1874508798960
2、什么样的字符串会有驻留机制?(仅限于交互模式)
- 字符串的长度为0或1时(即便带有非标识符)
s1 = ''
s2 = ''
print(s1 is s2) #True
str1 = ’%‘
str2 = '%'
print(str1 is str2) #True
- 全是符号标识符的字符串
s1 = 'abc%'
s2 = 'abc%'
print(s1 == s2) #True
print(s1 is s2) #False
str1 = ’abcx‘
str2 = 'abcx'
print(str1 is str2) #True
- 字符串只在编译时驻留,而非运行时
s1 = 'abc'
s2 = 'ab+c'
s3 = ''.join(['ab' , 'c'])
print(s1) #abc
print(s2) #abc
print(s3) #abc
print(type(s1)) #<class 'str'>
print(type(s2)) #<class 'str'>
print(type(s3)) #<class 'str'>
print(s1 is s2) #True
print(s1 is s3) #False
这里s1与s3的地址不同的原因在于s1的赋值和s2的字符串拼接是在运行前完成的,而".join"方法是在运行时执行的,在程序运行期间会开辟新的空间去存储abc的值。
- [-5, 256]之间的整数数字
s1 = -5
s2 = -5'
print(s1 is s2) #True
str1 = -6
str2 = -6
print(str1 is str2) #False
3、强制驻留
- 当然,python中可以用sys中的intern方法强制2个字符串指向同一个对象,也就是强制字符串驻留,两个变量指向同一个空间。
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2) #False
s1 = sys.intern(s2)
print(s1 is s2) #True
4、为什么上面说这些情况只给予交互模式,那么pycharm中呢?其实pycharm对字符串进行了优化处理,原本不驻留的情况在pycharm中却是驻留的
#pycharm环境下:
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2) #True
5、字符串驻留机制的优缺点
- 当需要值相同的字符串时,可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。
- 在需要进行字符串拼接时建议使用str类型的join方法,而非+,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比"+”高。
三、字符串的常用操作
1、查询
- 注意索引是从0开始
方法名称 | 作用 |
---|---|
index() | 查找子串substr第一次出现的位置,如果查找的子串不存在时,则抛出ValueError |
rindex() | 查找子串substr最后一次出现的位置,如果查找的子串不存在时,则抛出ValueError |
find() | 查找子串substr第一次出现的位置,如果查找的子串不存在时,则返回-1 |
rfind() | 查找子串substr最后一次出现的位置,如果查找的子串不存在时,则返回-1 |
2、大小写转换
- 注意转换大小写后,一定会产生一个新的字符串对象,即便转换前后的字符串内容是一样的(不可驻留)
方法名称 | 作用 |
---|---|
upper() | 把字符串中所有字符都转成大写字母 |
lower() | 把字符串中所有字符都转成小写字母 |
swapcase() | 把字符串中所有大写字母转成小写字母,把所有小写字母都转成大写字母 |
capitalize() | 把第一个字符转换为大写,把其余字符转换为小写 |
title() | 把每个单词的第一个字符转换为大写,把每个单词的剩余字符转换为小写 |
3、对齐
- 居中对齐往两边填充,左对齐往右边填充,右对齐往左边填充
s = 'Hello,Python' #十二个字符
#宽度设置为20,会把字符串延长至20个字符,也就是多了八个,这八个位置用*填充,将字符串s居中。
print(s.center(20,'*')) #****Hello,Python****
print(s.ljust(20,'*')) #Hello,Python********
print(s.rjust(20,'*')) #********Hello,Python
- 需要注意的是当字符串首位是’+‘或’-‘时zfill会将’+‘或’-'置于首位,并作为扩充字符。
print('-8910',zfill(8)) #-0008910
方法名称 | 作用 |
---|---|
center() | 居中对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串 |
ljust() | 左对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串 |
rjust() | 右对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串 |
zfill() | 右对齐,左边用0填充,该方法只接收一个参数,用于指定字符串的宽度,如果指定的宽度小于等于字符串的长度,返回字符串本身 |
4、劈分
- split()和rsplit()只有当指定最大分割次数maxsplit时才有区别。
方法名称 | 作用 |
---|---|
split() | 从字符串的左边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表 |
以参数sep指定劈分字符串的劈分符 | |
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分 | |
rsplit() | 从字符串的右边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表 |
以参数sep指定劈分字符串的劈分符 | |
通过参数naxsp1it指定劳分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分 |
5、判断
- 注意isalpha()和isalnum判断字符串时,中文也认为是字母
print('张三'.isalpha()) #True
print('张三123'.isalnum()) #True
- isdecimal()和isnumeric()的区别
print('123'.isdecimal()) #True
print('123四'.isdecimal()) #False
print('ⅡⅠ'.isdecimal()) #False
print('123'.isnumeric()) #True
print('123四'.isnumeric()) #True
print('ⅡⅠ'.isnumeric()) #True
方法名称 | 作用 |
---|---|
isidentifier() | 判断指定的字符串是不是合法的标识符 |
isspace() | 判断指定的字符串是否全部由空白字符组成(回车、换行,水平制表符) |
isalpha() | 判断指定的字符串是否全部由字母组成 |
isdecimal() | 判断指定字符串是否全部由十进制的数字组成 |
isnumeric | 判断指定的字符串是否全部由数字组成 |
isalnum | 判断指定字符串是否全部由字母和数字组成 |
6、替换与合并
功能 | 方法名称 | 作用 |
---|---|---|
字符串替换 | replace() | 第1个参数指定被替换的子串,第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串,替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数 |
字符串的合并 | join() | 将列表或元组中的字符串合并成一个字符串 |
7、比较
- 运算符:>,>=,<,<=,==(比较value),!=,is(比较id)
- 比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较
- 比较原理:两上字符进行比较时,比较的是其ordinal value(即原始值,或者说Unicode编码),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符
8、切片
- 字符串是不可变类型,不具备增、删、改等操作
- 切片操作将产生新的对象
- [start : end : step]为左闭右开,step默认为1,不定义start则从0开始,不定义end则到字符串的最后一个元素(-1)。step也可以为负数,如[ : : -1]默认从字符串的最后一个元素开始,到字符串的第一个元素结束
9、格式化
字符串的格式化也可以用拼接完成,但拼接占用内存大,所以一般还是有格式化。
- 三种常用的格式化方法
name = '张三'
age = 20
#(1)%占位符 %s为字符串,%d为整数,%f为浮点数
print('我叫%s,今年%d岁' % (name, age)) #我叫张三,今年20岁
#(2){}.format
print('我叫{0},今年{1}岁,我真的叫{0}'.format(name, age)) #我叫张三,今年20岁,我真的叫张三
#(3)f-string
print(f'我叫{name},今年{age}岁') #我叫张三,今年20岁
- 宽度、精度的表示可以用占位符或{}
#10表示宽度为10(前面空8位)
print('%10d' % 99) # 10
#.3表示保留三位小数
print('%.3f' % 3.1415926) #3.142
#同时表示宽度和精度(前面空5位)
print('%10.3f' % 3.1415926) # 3.142
#0表示第一个占位符,.3表示一共显示三位数
print('{0:.3}'.format(3.1415926)) #3.14
#.3f表示一共显示三位小数
print('{0:.3f}'.format(3.1415926)) #3.142
#10.3f表示一共显示10位,其中三位是小数(前面5个空格)
print('{0:10.3f}'.format(3.1415926)) # 3.142
10、编码与解码
编码的原因是计算机之间的数据传输是基于二进制数据。
- 编码:将字符串转换为二进制数据(bytes)
str.encode(encoding=‘UTF-8’) - 解码:将bytes类型的数据转换为字符串类型
byte.decode(encoding=‘UTF-8’) - 需要注意的是编码和解码用的编码格式要相同,如编码时用的UTF-8,解码时也要用UTF-8
数据类型转换
函数名 | 作用 | 注意事项 | 举例 |
---|---|---|---|
str() | 将其他数据类型转成字符串 | 也可用引号转换 | str(123);‘123’ |
int() | 将其他数据类型转成整数 | 1、文字类和带小数类字符串无法转换成整数 2、浮点数转化为整数:抹零取整 | int(‘123’);int(9.8) |
float() | 将其他数据类型转成浮点数 | 1、文字类无法转换成浮点数 2、整数转成浮点数,末尾为.0 | float(‘9.9’);float(9) |
以上是关于python笔记——常见数据类型及注意点的主要内容,如果未能解决你的问题,请参考以下文章