[py]编码 Unicode utf-8
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[py]编码 Unicode utf-8相关的知识,希望对你有一定的参考价值。
0,
utf-8占3个byte
Unicode占2个byte,而且较为智能,字符自动占一个字符
anscii占1个byte
?
1,实例
>>>name=‘马明‘ #xshell默认存成了utf8
>>>name
>>>‘\xe9\xa9\xac\xe6\x98\x8e‘
>>>
>>>print ‘\xe9\xa9\xac\xe6\x98\x8e‘ #可以直接打印utf8
>>>马明
>>>
>>>type(name)
>>>str
>>>
?
2,定义Unicode编码
2.1从utf-8转换到Unicode
>>>name.decode(‘utf-8‘)
>>>u‘\u9a6c\u660e‘
?
#name本身存成了utf8编码
将name解码成Unicode
>>>b=name.decode(‘utf-8‘)
>>>
>>>b
>>>u‘\u9a6c\u660e‘
>>>
#将Unicode编码成utf-8
>>>b.encode(‘utf-8‘)
>>>‘\xe9\xa9\xac\xe6\x98\x8e‘
#####文件里使用#coding=utf8
2.2自己指定存放编码
>>>name=u‘马明‘
以上是关于[py]编码 Unicode utf-8的主要内容,如果未能解决你的问题,请参考以下文章