python笔记——常见数据类型及注意点

Posted LeoJarvis

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python笔记——常见数据类型及注意点相关的知识,希望对你有一定的参考价值。

整数类型int

十进制 → 默认的进制
二进制 → 以0b开头(数字0和小写字母b)
八进制 → 以0o开头(数字0和小写字母o)
十六进制 → 0x开头(数字0和小写字母x)

进制基本数逢几进一表示形式
十进制0,1,2,3,4,5,6,7,8,910118
二进制0,120b1110110
八进制0,1,2,3,4,5,6,780o166
十六进制0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F160x76

浮点类型

浮点数由整数部分和小数部分构成,涉及小数部分会有一个问题,因为计算机使用二进制表示,那么在表示小数的时候就会有点误差,导致浮点数存储不精确
如:

print(1.1+2.2)  #3.30000000003
print(1.1+2.1)  #3.2

可以看到1.1+2.2的结果有一个极小误差,这个问题可以通过导入模块decimal进行解决

from decimal import Decimal
print(Decimal(1.1)+Decimal(2.2))  #3.3

布尔类型

布尔是boolean的简写bool的谐音
True为真,False为假
与其他语言不同的是,python布尔类型可以转成整数进行计算,其中True可以表示1,False可以表示0

print(True+1)  #2
print(False+1) #1

字符串类型

一、定义

字符串可以使用单引号’ ‘、双引号" "、三引号’’’ ‘’'或""" “”"来定义,区别在于单引号和双引号定义的字符串必须在一行中显示,而三引号定义的字符串可以显示在连续的多行。

str1 = '人生苦短,我用python'
str2 = "人生苦短,我用python"
str3 = '''人生苦短,
我用python'''

二、驻留机制

字符串又被称为不可变的字符序列(同为不可变序列的还有元组),这涉及到了字符串的驻留机制
1、驻留机制即“仅保存一份相同且不可变字符串的方法”,不同的值被存放在字符串的驻留池中,Python的驻留机制对相同的字符串只保留一份拷贝,后续创建相同字符串时,不会开辟新空间,而是把该字符串的地址赋给新创建的变量
在这里插入图片描述
可以看到,无论先后以何种方式创建相同的字符串,都是把驻留池中的该字符串赋给各变量。

a = 'python'
b = "python"
c = '''python'''

print(id(a)) #1874508798960
print(id(b)) #1874508798960
print(id(c)) #1874508798960

2、什么样的字符串会有驻留机制?(仅限于交互模式)

  • 字符串的长度为0或1时(即便带有非标识符)
s1 = ''
s2 = ''
print(s1 is s2) #True

str1 =%‘
str2 = '%'
print(str1 is str2) #True
  • 全是符号标识符的字符串
s1 = 'abc%'
s2 = 'abc%'
print(s1 == s2) #True
print(s1 is s2) #False

str1 = ’abcx‘
str2 = 'abcx'
print(str1 is str2) #True
  • 字符串只在编译时驻留,而非运行时
s1 = 'abc'
s2 = 'ab+c'
s3 = ''.join(['ab' , 'c'])

print(s1)   #abc
print(s2)   #abc
print(s3)   #abc

print(type(s1))   #<class 'str'>
print(type(s2))   #<class 'str'>
print(type(s3))   #<class 'str'>

print(s1 is s2)   #True
print(s1 is s3)   #False

这里s1与s3的地址不同的原因在于s1的赋值和s2的字符串拼接是在运行前完成的,而".join"方法是在运行时执行的,在程序运行期间会开辟新的空间去存储abc的值。

  • [-5, 256]之间的整数数字
s1 = -5
s2 = -5'
print(s1 is s2) #True

str1 = -6
str2 = -6
print(str1 is str2) #False

3、强制驻留

  • 当然,python中可以用sys中的intern方法强制2个字符串指向同一个对象,也就是强制字符串驻留,两个变量指向同一个空间。
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #False

s1 = sys.intern(s2)
print(s1 is s2)   #True

4、为什么上面说这些情况只给予交互模式,那么pycharm中呢?其实pycharm对字符串进行了优化处理,原本不驻留的情况在pycharm中却是驻留的

#pycharm环境下:
import sys
s1 = 'abc%'
s2 = 'abc%'
print(s1 is s2)   #True

5、字符串驻留机制的优缺点

  • 当需要值相同的字符串时,可以直接从字符串池里拿来使用,避免频繁的创建和销毁,提升效率和节约内存,因此拼接字符串和修改字符串是会比较影响性能的。
  • 在需要进行字符串拼接时建议使用str类型的join方法,而非+,因为join()方法是先计算出所有字符中的长度,然后再拷贝,只new一次对象,效率要比"+”高。

三、字符串的常用操作

1、查询

  • 注意索引是从0开始
方法名称作用
index()查找子串substr第一次出现的位置,如果查找的子串不存在时,则抛出ValueError
rindex()查找子串substr最后一次出现的位置,如果查找的子串不存在时,则抛出ValueError
find()查找子串substr第一次出现的位置,如果查找的子串不存在时,则返回-1
rfind()查找子串substr最后一次出现的位置,如果查找的子串不存在时,则返回-1

2、大小写转换

  • 注意转换大小写后,一定会产生一个新的字符串对象,即便转换前后的字符串内容是一样的(不可驻留)
方法名称作用
upper()把字符串中所有字符都转成大写字母
lower()把字符串中所有字符都转成小写字母
swapcase()把字符串中所有大写字母转成小写字母,把所有小写字母都转成大写字母
capitalize()把第一个字符转换为大写,把其余字符转换为小写
title()把每个单词的第一个字符转换为大写,把每个单词的剩余字符转换为小写

3、对齐

  • 居中对齐往两边填充,左对齐往右边填充,右对齐往左边填充
s = 'Hello,Python'  #十二个字符
#宽度设置为20,会把字符串延长至20个字符,也就是多了八个,这八个位置用*填充,将字符串s居中。
print(s.center(20,'*'))   #****Hello,Python****
print(s.ljust(20,'*'))   #Hello,Python********
print(s.rjust(20,'*'))   #********Hello,Python
  • 需要注意的是当字符串首位是’+‘或’-‘时zfill会将’+‘或’-'置于首位,并作为扩充字符。
print('-8910',zfill(8))   #-0008910
方法名称作用
center()居中对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
ljust()左对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
rjust()右对齐,第1个参数指定宽度,第2个参数指定填充符,第2个参数是可选的,默认是空格,如果设置宽度小于实际宽度则返回原字符串
zfill()右对齐,左边用0填充,该方法只接收一个参数,用于指定字符串的宽度,如果指定的宽度小于等于字符串的长度,返回字符串本身

4、劈分

  • split()和rsplit()只有当指定最大分割次数maxsplit时才有区别。
方法名称作用
split()从字符串的左边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表
以参数sep指定劈分字符串的劈分符
通过参数maxsplit指定劈分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分
rsplit()从字符串的右边开始劈分,默认的劈分字符是空格字符串,返回的值都是一个列表
以参数sep指定劈分字符串的劈分符
通过参数naxsp1it指定劳分字符串时的最大劈分次数,在经过最大次数劈分之后,剩余的子串会单独做为一部分

5、判断

  • 注意isalpha()和isalnum判断字符串时,中文也认为是字母
print('张三'.isalpha())   #True
print('张三123'.isalnum())   #True
  • isdecimal()和isnumeric()的区别
print('123'.isdecimal())   #True
print('123四'.isdecimal())   #False
print('ⅡⅠ'.isdecimal())   #False

print('123'.isnumeric())   #True
print('123四'.isnumeric())   #True
print('ⅡⅠ'.isnumeric())   #True
方法名称作用
isidentifier()判断指定的字符串是不是合法的标识符
isspace()判断指定的字符串是否全部由空白字符组成(回车、换行,水平制表符)
isalpha()判断指定的字符串是否全部由字母组成
isdecimal()判断指定字符串是否全部由十进制的数字组成
isnumeric判断指定的字符串是否全部由数字组成
isalnum判断指定字符串是否全部由字母和数字组成

6、替换与合并

功能方法名称作用
字符串替换replace()第1个参数指定被替换的子串,第2个参数指定替换子串的字符串,该方法返回替换后得到的字符串,替换前的字符串不发生变化,调用该方法时可以通过第3个参数指定最大替换次数
字符串的合并join()将列表或元组中的字符串合并成一个字符串

7、比较

  • 运算符:>,>=,<,<=,==(比较value),!=,is(比较id)
  • 比较规则:首先比较两个字符串中的第一个字符,如果相等则继续比较下一个字符,依次比较下去,直到两个字符串中的字符不相等时,其比较结果就是两个字符串的比较结果,两个字符串中的所有后续字符将不再被比较
  • 比较原理:两上字符进行比较时,比较的是其ordinal value(即原始值,或者说Unicode编码),调用内置函数ord可以得到指定字符的ordinal value。与内置函数ord对应的是内置函数chr,调用内置函数chr时指定ordinal value可以得到其对应的字符

8、切片

  • 字符串是不可变类型,不具备增、删、改等操作
  • 切片操作将产生新的对象
  • [start : end : step]为左闭右开,step默认为1,不定义start则从0开始,不定义end则到字符串的最后一个元素(-1)。step也可以为负数,如[ : : -1]默认从字符串的最后一个元素开始,到字符串的第一个元素结束

9、格式化
字符串的格式化也可以用拼接完成,但拼接占用内存大,所以一般还是有格式化。

  • 三种常用的格式化方法
name = '张三'
age = 20
#(1)%占位符 %s为字符串,%d为整数,%f为浮点数
print('我叫%s,今年%d岁' % (name, age))  #我叫张三,今年20岁

#(2){}.format
print('我叫{0},今年{1}岁,我真的叫{0}'.format(name, age))  #我叫张三,今年20岁,我真的叫张三

#(3)f-string
print(f'我叫{name},今年{age}岁')  #我叫张三,今年20岁
  • 宽度、精度的表示可以用占位符或{}
#10表示宽度为10(前面空8位)
print('%10d' % 99)  #        10
#.3表示保留三位小数
print('%.3f' % 3.1415926)   #3.142
#同时表示宽度和精度(前面空5位)
print('%10.3f' % 3.1415926)   #     3.142
#0表示第一个占位符,.3表示一共显示三位数
print('{0:.3}'.format(3.1415926))   #3.14
#.3f表示一共显示三位小数
print('{0:.3f}'.format(3.1415926))   #3.142
#10.3f表示一共显示10位,其中三位是小数(前面5个空格)
print('{0:10.3f}'.format(3.1415926))   #     3.142

10、编码与解码
编码的原因是计算机之间的数据传输是基于二进制数据。

  • 编码:将字符串转换为二进制数据(bytes)
    str.encode(encoding=‘UTF-8’)
  • 解码:将bytes类型的数据转换为字符串类型
    byte.decode(encoding=‘UTF-8’)
  • 需要注意的是编码和解码用的编码格式要相同,如编码时用的UTF-8,解码时也要用UTF-8

数据类型转换

函数名作用注意事项举例
str()将其他数据类型转成字符串也可用引号转换str(123);‘123’
int()将其他数据类型转成整数1、文字类和带小数类字符串无法转换成整数 2、浮点数转化为整数:抹零取整int(‘123’);int(9.8)
float()将其他数据类型转成浮点数1、文字类无法转换成浮点数 2、整数转成浮点数,末尾为.0float(‘9.9’);float(9)

在这里插入图片描述

以上是关于python笔记——常见数据类型及注意点的主要内容,如果未能解决你的问题,请参考以下文章

《流畅的python》学习笔记及书评

《流畅的python》学习笔记及书评

C#学习笔记——需要注意的基础知识

使用索引的注意事项及常见场景案例

v使用索引的注意事项及常见场景案例

python爬虫常见的那点问题!