3 -11 字符编码与转换

Posted 滕虎

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了3 -11 字符编码与转换相关的知识,希望对你有一定的参考价值。

中文的字符编码  是 gbk   windows 默认的字符编码也是gbk

每个国家都有自己的字符编码 为了 统一 就有了

unicode

##unicode 不管英文中文都占 2个字节  16位

ascii码 一个英文一个字节  不能存中文。。 8 位 英文 或特殊字符

转换后 中文 变成3个字节

其中utf-8 是  Unicode的 可变长度的扩展级

 encode 是编码    decode  是 解码   

 

import sys
print(sys.getdefaultencoding())
### 查看系统编码是 什么

 

 

 

utf-8 转换成  gbk

1,首先你要去Unicode 里告诉 它  我是 utf-8    decode()解压

2  然后再编码成 gbk 格式 显示

gbk 转换 utf-8

1,首先去unicode 里告诉自己是 gbk       decode(\'gbk\')

2 , 然后再编码成 utf-8  展现       encode(\'utf-8\')

 


 

 增加点内容 

python  默认走 unicode   

如果是 gbk 格式的    

首先需要声明 自己是 gbk ---告诉 unicode 我是 gbk--编码 --utf8

 

以上是关于3 -11 字符编码与转换的主要内容,如果未能解决你的问题,请参考以下文章

求帮助,编码转换的问题 python 3.4.0

字符编码

js字符串与Unicode编码互相转换

8.数值进制运算与字符编码转换

Java-IO流之转换流的使用和编码与解码原理

字符串与bytes