3 -11 字符编码与转换
Posted 滕虎
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3 -11 字符编码与转换相关的知识,希望对你有一定的参考价值。
中文的字符编码 是 gbk windows 默认的字符编码也是gbk
每个国家都有自己的字符编码 为了 统一 就有了
unicode
##unicode 不管英文中文都占 2个字节 16位
ascii码 一个英文一个字节 不能存中文。。 8 位 英文 或特殊字符
转换后 中文 变成3个字节
其中utf-8 是 Unicode的 可变长度的扩展级
encode 是编码 decode 是 解码
import sys
print(sys.getdefaultencoding()) ### 查看系统编码是 什么
utf-8 转换成 gbk
1,首先你要去Unicode 里告诉 它 我是 utf-8 decode()解压
2 然后再编码成 gbk 格式 显示
gbk 转换 utf-8
1,首先去unicode 里告诉自己是 gbk decode(\'gbk\')
2 , 然后再编码成 utf-8 展现 encode(\'utf-8\')
增加点内容
python 默认走 unicode
如果是 gbk 格式的
首先需要声明 自己是 gbk ---告诉 unicode 我是 gbk--编码 --utf8
以上是关于3 -11 字符编码与转换的主要内容,如果未能解决你的问题,请参考以下文章