python笔记——常见数据类型及注意点

Posted 2021-08-19 LeoJarvis

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python笔记——常见数据类型及注意点相关的知识，希望对你有一定的参考价值。

整数类型int

十进制 → 默认的进制
二进制 → 以0b开头（数字0和小写字母b）
八进制 → 以0o开头（数字0和小写字母o）
十六进制 → 0x开头（数字0和小写字母x）

进制	基本数	逢几进一	表示形式
十进制	0,1,2,3,4,5,6,7,8,9	10	118
二进制	0,1	2	0b1110110
八进制	0,1,2,3,4,5,6,7	8	0o166
十六进制	0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F	16	0x76

浮点类型

浮点数由整数部分和小数部分构成，涉及小数部分会有一个问题，因为计算机使用二进制表示，那么在表示小数的时候就会有点误差，导致浮点数存储不精确
如：

print(1.1+2.2)  #3.30000000003
print(1.1+2.1)  #3.2

可以看到1.1+2.2的结果有一个极小误差，这个问题可以通过导入模块decimal进行解决

from decimal import Decimal
print(Decimal(1.1)+Decimal(2.2))  #3.3

布尔类型

布尔是boolean的简写bool的谐音
True为真，False为假
与其他语言不同的是，python布尔类型可以转成整数进行计算，其中True可以表示1，False可以表示0

print(True+1)  #2
print(False+1) #1

字符串类型

一、定义

字符串可以使用单引号’ ‘、双引号" "、三引号’’’ ‘’'或""" “”"来定义，区别在于单引号和双引号定义的字符串必须在一行中显示，而三引号定义的字符串可以显示在连续的多行。

str1 = '人生苦短，我用python'
str2 = "人生苦短，我用python"
str3 = '''人生苦短，
我用python'''

二、驻留机制

字符串又被称为不可变的字符序列（同为不可变序列的还有元组），这涉及到了字符串的驻留机制
1、驻留机制即“仅保存一份相同且不可变字符串的方法”，不同的值被存放在字符串的驻留池中，Python的驻留机制对相同的字符串只保留一份拷贝，后续创建相同字符串时，不会开辟新空间，而是把该字符串的地址赋给新创建的变量
在这里插入图片描述
可以看到，无论先后以何种方式创建相同的字符串，都是把驻留池中的该字符串赋给各变量。

a = 'python'
b = "python"
c = '''python'''

print(id(a)) #1874508798960
print(id(b)) #1874508798960
print(id(c)) #1874508798960

2、什么样的字符串会有驻留机制？(仅限于交互模式)

字符串的长度为0或1时（即便带有非标识符）

s1 = ''
s2 = ''
print(s1 is s2) #True

str1 = ’%‘
str2 = '%'
print(str1 is str2) #True

全是符号标识符的字符串

s1 = 'abc%'
s2 = 'abc%'
print(s1 == s2) #True
print(s1 is s2) #False

str1 = ’abcx‘
str2 = 'abcx'
print(str1 is str2) #True

字符串只在编译时驻留，而非运行时

s1 = 'abc'
s2 = 'ab+c'
s3 = ''.join(['ab' , 'c'])

print(s1)   #abc
print(s2)   #abc
print(s3)   #abc

print(type(s1))   #<class 'str'>
print(type(s2))   #<class 'str'>
print(type(s3))   #<class 'str'>

print(s1 is s2)   #True
print(s1 is s3)   #False

这里s1与s3的地址不同的原因在于s1的赋值和s2的字符串拼接是在运行前完成的，而".join"方法是在运行时执行的，在程序运行期间会开辟新的空间去存储abc的值。

[-5, 256]之间的整数数字

s1 = -5
s2 = -5'
print(s1 is s2) #True

str1 = -6
str2 = -6
print(str1 is str2) #False

3、强制驻留

当然，python中可以用sys中的intern方法强制2个字符串指向同一个对象，也就是强制字符串驻留，两个变量指向同一个空间。

import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #False

s1 = sys.intern(s2)
print(s1 is s2)   #True

4、为什么上面说这些情况只给予交互模式，那么pycharm中呢？其实pycharm对字符串进行了优化处理，原本不驻留的情况在pycharm中却是驻留的

#pycharm环境下：
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #True

5、字符串驻留机制的优缺点

当需要值相同的字符串时，可以直接从字符串池里拿来使用，避免频繁的创建和销毁，提升效率和节约内存，因此拼接字符串和修改字符串是会比较影响性能的。
在需要进行字符串拼接时建议使用str类型的join方法，而非+，因为join()方法是先计算出所有字符中的长度，然后再拷贝，只new一次对象，效率要比"+”高。

三、字符串的常用操作

1、查询

注意索引是从0开始

方法名称	作用
index()	查找子串substr第一次出现的位置，如果查找的子串不存在时，则抛出ValueError
rindex()	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则抛出ValueError
find()	查找子串substr第一次出现的位置，如果查找的子串不存在时，则返回-1
rfind()	查找子串substr最后一次出现的位置，如果查找的子串不存在时，则返回-1

2、大小写转换

注意转换大小写后，一定会产生一个新的字符串对象，即便转换前后的字符串内容是一样的（不可驻留）

方法名称	作用
upper()	把字符串中所有字符都转成大写字母
lower()	把字符串中所有字符都转成小写字母
swapcase()	把字符串中所有大写字母转成小写字母，把所有小写字母都转成大写字母
capitalize()	把第一个字符转换为大写，把其余字符转换为小写
title()	把每个单词的第一个字符转换为大写，把每个单词的剩余字符转换为小写

3、对齐

居中对齐往两边填充，左对齐往右边填充，右对齐往左边填充

s = 'Hello,Python'  #十二个字符
#宽度设置为20，会把字符串延长至20个字符，也就是多了八个，这八个位置用*填充，将字符串s居中。
print(s.center(20,'*'))   #****Hello,Python****
print(s.ljust(20,'*'))   #Hello,Python********
print(s.rjust(20,'*'))   #********Hello,Python

需要注意的是当字符串首位是’+‘或’-‘时zfill会将’+‘或’-'置于首位，并作为扩充字符。

print('-8910',zfill(8))   #-0008910

方法名称	作用
center()	居中对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
ljust()	左对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
rjust()	右对齐，第1个参数指定宽度，第2个参数指定填充符，第2个参数是可选的，默认是空格，如果设置宽度小于实际宽度则返回原字符串
zfill()	右对齐，左边用0填充，该方法只接收一个参数，用于指定字符串的宽度，如果指定的宽度小于等于字符串的长度，返回字符串本身

4、劈分

split()和rsplit()只有当指定最大分割次数maxsplit时才有区别。

方法名称	作用
split()	从字符串的左边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表
	以参数sep指定劈分字符串的劈分符
	通过参数maxsplit指定劈分字符串时的最大劈分次数，在经过最大次数劈分之后，剩余的子串会单独做为一部分
rsplit()	从字符串的右边开始劈分，默认的劈分字符是空格字符串，返回的值都是一个列表
	以参数sep指定劈分字符串的劈分符
	通过参数naxsp1it指定劳分字符串时的最大劈分次数，在经过最大次数劈分之后，剩余的子串会单独做为一部分

5、判断

注意isalpha()和isalnum判断字符串时，中文也认为是字母

print('张三'.isalpha())   #True
print('张三123'.isalnum())   #True

isdecimal()和isnumeric()的区别

print('123'.isdecimal())   #True
print('123四'.isdecimal())   #False
print('ⅡⅠ'.isdecimal())   #False

print('123'.isnumeric())   #True
print('123四'.isnumeric())   #True
print('ⅡⅠ'.isnumeric())   #True

方法名称	作用
isidentifier()	判断指定的字符串是不是合法的标识符
isspace()	判断指定的字符串是否全部由空白字符组成（回车、换行，水平制表符）
isalpha()	判断指定的字符串是否全部由字母组成
isdecimal()	判断指定字符串是否全部由十进制的数字组成
isnumeric	判断指定的字符串是否全部由数字组成
isalnum	判断指定字符串是否全部由字母和数字组成

6、替换与合并

功能	方法名称	作用
字符串替换	replace()	第1个参数指定被替换的子串，第2个参数指定替换子串的字符串，该方法返回替换后得到的字符串，替换前的字符串不发生变化，调用该方法时可以通过第3个参数指定最大替换次数
字符串的合并	join()	将列表或元组中的字符串合并成一个字符串

7、比较

运算符：>，>=，<，<=，==(比较value)，!=，is(比较id)
比较规则：首先比较两个字符串中的第一个字符，如果相等则继续比较下一个字符，依次比较下去，直到两个字符串中的字符不相等时，其比较结果就是两个字符串的比较结果，两个字符串中的所有后续字符将不再被比较
比较原理：两上字符进行比较时，比较的是其ordinal value（即原始值，或者说Unicode编码），调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr，调用内置函数chr时指定ordinal value可以得到其对应的字符

8、切片

字符串是不可变类型，不具备增、删、改等操作
切片操作将产生新的对象
[start : end : step]为左闭右开，step默认为1，不定义start则从0开始，不定义end则到字符串的最后一个元素(-1)。step也可以为负数，如[ : : -1]默认从字符串的最后一个元素开始，到字符串的第一个元素结束

9、格式化
字符串的格式化也可以用拼接完成，但拼接占用内存大，所以一般还是有格式化。

三种常用的格式化方法

name = '张三'
age = 20
#（1）%占位符 %s为字符串，%d为整数，%f为浮点数
print('我叫%s，今年%d岁' % (name, age))  #我叫张三，今年20岁

#（2）{}.format
print('我叫{0}，今年{1}岁，我真的叫{0}'.format(name, age))  #我叫张三，今年20岁，我真的叫张三

#（3）f-string
print(f'我叫{name}，今年{age}岁')  #我叫张三，今年20岁

宽度、精度的表示可以用占位符或{}

#10表示宽度为10（前面空8位)
print('%10d' % 99)  #        10
#.3表示保留三位小数
print('%.3f' % 3.1415926)   #3.142
#同时表示宽度和精度（前面空5位)
print('%10.3f' % 3.1415926)   #     3.142

#0表示第一个占位符，.3表示一共显示三位数
print('{0:.3}'.format(3.1415926))   #3.14
#.3f表示一共显示三位小数
print('{0:.3f}'.format(3.1415926))   #3.142
#10.3f表示一共显示10位，其中三位是小数（前面5个空格）
print('{0:10.3f}'.format(3.1415926))   #     3.142

10、编码与解码
编码的原因是计算机之间的数据传输是基于二进制数据。

编码：将字符串转换为二进制数据（bytes）
str.encode(encoding=‘UTF-8’)
解码：将bytes类型的数据转换为字符串类型
byte.decode(encoding=‘UTF-8’)
需要注意的是编码和解码用的编码格式要相同，如编码时用的UTF-8，解码时也要用UTF-8

数据类型转换

函数名	作用	注意事项	举例
str()	将其他数据类型转成字符串	也可用引号转换	str(123)；‘123’
int()	将其他数据类型转成整数	1、文字类和带小数类字符串无法转换成整数 2、浮点数转化为整数：抹零取整	int(‘123’)；int(9.8)
float()	将其他数据类型转成浮点数	1、文字类无法转换成浮点数 2、整数转成浮点数，末尾为.0	float(‘9.9’)；float(9)

在这里插入图片描述

以上是关于python笔记——常见数据类型及注意点的主要内容，如果未能解决你的问题，请参考以下文章