python2.7 处理unicode和ascii字符串混用问题

Posted 嗡嘛呢巴美吽舍

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python2.7 处理unicode和ascii字符串混用问题相关的知识,希望对你有一定的参考价值。

python2.7默认的编码方式为ascii码,如下可以查询:

import sys
sys.getdefaultencoding()

如果直接在unicode和ascii字符串之间做计算、比较、连接,都会出错:

s = 您好
u = u您好
s == u
__main__:1: UnicodeWarning: Unicode equal comparison failed to convert both arguments to Unicode - interpreting them as being unequal

原因是:在进行同时包含 str 与 unicode 的运算时,Python 一律都把 str 转换成 unicode 再运算,当然,运算结果也都是 unicode。

正确的处理方法是:

import sys
reload(sys)
sys.setdefaultencoding(utf-8)
s = 您好
u = u您好
s == u

结果会返回True

 

 

ref: http://in355hz.iteye.com/blog/1860787

 

以上是关于python2.7 处理unicode和ascii字符串混用问题的主要内容,如果未能解决你的问题,请参考以下文章

解决Python2.7的UnicodeEncodeError: ‘ascii’ codec can’t encode异常错误

python2项目出现的错误(UnicodeDecodeError)

解决ArcPy脚本工具中文乱码问题

解决ArcPy脚本工具中文乱码问题

Python中的Unicode编码和UTF-8编码

python2.7 字符处理小节