python2.7 字符处理小节

Posted 笔记本

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python2.7 字符处理小节相关的知识,希望对你有一定的参考价值。

 

unicode是字符集

utf-8,gbk是编码方式,将字符集编码为机器识别的字节码

#encoding: utf-8


s = "中文"  #unicode的utf-8编码,xE4xB8xADxE6x96x87
us = u"中文"  #unicode字符集 u4E2D u6587

print repr(s)
print repr(us)

print s.decode(utf-8)   #utf-8解码为无编码的unicode u4E2D u6587
print us.encode(utf-8)  #uicode编码为utf-8
print repr(us.encode(‘gbk‘)) #uicode编码为gbk: ‘xd6xd0xcexc4‘
str=u4E2Du6587 
print str str2= str.decode(unicode-escape) #字符串转换为unicode编码

print str2

print repr(str)

 






以上是关于python2.7 字符处理小节的主要内容,如果未能解决你的问题,请参考以下文章

对Python2.7处理字符串方法的记录

Python2.7-struct模块

将带有内部空字符的python2.7字符串传递给c ++

Python string中删除(过滤)掉emoji表情字符

在python 3.6中处理自定义编码时遇到类型错误

知识点-Spark小节