恶心的字符编码

Posted 昂达达

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了恶心的字符编码相关的知识,希望对你有一定的参考价值。

字符编码
内存默认用unicode-快
磁盘用的utf-8-小

#存储过程中
内存unicode --decode--> utf-8磁盘
utf-8磁盘 --encode--> 内存unicode

 

#执行过程中
内存unicode --encode--> utf-8(bytes)
utf-8(bytes) --decode--> 内存unicode


python3 所有字符串都是unicode
所以字符串只有 encode方法
*.py 文件头上面 写的是代码保存在硬盘上的,以及读取的字符集

python2中 字符串类型有俩种
str
unicode

str --decode--> utf-8
没有encode
unicode 和python3一样

 

以上是关于恶心的字符编码的主要内容,如果未能解决你的问题,请参考以下文章

如何查看字符编码类型

关于JS中字符串的编码

Python 字符集编码 - UTF-8 编码

如何查看字符编码类型

unicode字符集是多少位的字符编码

刨根究底字符编码之九——字符编码方案的演变与字节序