python3中编码和解码
Posted wl413911
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python3中编码和解码相关的知识,希望对你有一定的参考价值。
------------恢复内容开始------------
一、python3与python2.7在字符编码上的差异
- python2.7 默认编码是和所在的操作系统一致,windows 是 GBK,macOS是 utf8 ,linux是utf8
- python3 编码统一规定默认编码为 Unicode
二、python3中str和bytes的区别
(1)python3有两种数据类型:str 和bytes。
1、编码为Unicode的文本显示为str;
2、其他编码(比如gbk,utf8等)显示为bytes(16进制方式表示)
(2)在python3中的encode和decode都是相对于Unicode而言的
1、encode()方法是str类型数据拥有的方法,将Unicode编码的数据,转换为其他编码,作为新对象返回
2、decode()方法是bytes类型数据拥有的方法,将其他编码的数据解码为Unicode编码,作为新对象返回
三、在python3中,汉字的编码及其显示方式
例如,输入汉字“中文”时
编码方式 | 编码二进制格式 | 在屏幕中的显示 |
Unicode |
‘u4e2du6587‘
|
"中文" |
GBK | b‘xd6xd0xcexc4‘ | b‘xd6xd0xcexc4‘ |
UTF8 |
b‘xe4xb8xadxe6x96x87‘
|
b‘xe4xb8xadxe6x96x87‘ |
注解 |
b:代表bytes类型 ;x代表编码是16进制表示 ;u表示编码是Unicode
|
另外,ASCII码可以表示所有到的英文字符,仅占一个字节,ASCII码表示的字符会始终以字符形式在屏幕中显示。
四、当在python3中用open()方法打开文件的注意事项
open()方法有很多参数,其中常用的有
file:文件所在路径及文件名
mode:
r:只读,以text的模式打开文件
w:写入,以文本的模式打开文件,且打开时将文件内容清空
b :以bytes的模式打开文件
a:在文件后添加内容
r+:可读可写,在文件已有文本的后面继续写入
w+:以可读可写方式打开文件,且打开文件时,清空文件,文件不存在则创建文件
encoding:指定解码文件使用的‘编码方式’,比如‘utf8’、‘gbk’等,默认使用操作系统的编码方式。windows默认是GBK, macOS、linux默认使用utf8
------------恢复内容结束------------
以上是关于python3中编码和解码的主要内容,如果未能解决你的问题,请参考以下文章
Python3中字符串的编码与解码以及编码之间转换(decodeencode)