[py]编码 Unicode utf-8

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[py]编码 Unicode utf-8相关的知识,希望对你有一定的参考价值。

0,

utf-8占3个byte

Unicode占2个byte,而且较为智能,字符自动占一个字符

anscii占1个byte

?

1,实例

>>>name=‘马明‘ #xshell默认存成了utf8

>>>name

>>>‘\xe9\xa9\xac\xe6\x98\x8e‘

>>>

>>>print ‘\xe9\xa9\xac\xe6\x98\x8e‘ #可以直接打印utf8

>>>马明

>>>

>>>type(name)

>>>str

>>>

?

2,定义Unicode编码

2.1从utf-8转换到Unicode

>>>name.decode(‘utf-8‘)

>>>u‘\u9a6c\u660e‘

?

#name本身存成了utf8编码

将name解码成Unicode

>>>b=name.decode(‘utf-8‘)

>>>

>>>b

>>>u‘\u9a6c\u660e‘

>>>

#将Unicode编码成utf-8

>>>b.encode(‘utf-8‘)

>>>‘\xe9\xa9\xac\xe6\x98\x8e‘

#####文件里使用#coding=utf8

2.2自己指定存放编码

>>>name=u‘马明‘

以上是关于[py]编码 Unicode utf-8的主要内容,如果未能解决你的问题,请参考以下文章

[py]编码 Unicode utf-8

py3学习-----编码格式简介

py07.3字符编码

简单的回顾

python---字符编码

python编码