python基础篇----字符串unicode

Posted crazymanpj

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python基础篇----字符串unicode相关的知识,希望对你有一定的参考价值。

python中处理中文常要用到unicode,因为较容易遇到字符串编码的问题,我一般都是将字符串统一转成unicode去处理

 

python中定义一个unicode字符串,可以在字符串前面加u:

str=u"hello world"

 

python中定义不转义的字符串,可以在字符串前面加r:

path=r"c:\programfile\test"

 

解码将其他字符串格式转为unicode:

ret=str.decode("gb2312")
ret=str.decode("ascii")
ret=str.decode("utf-8")

 

编码将unicode字符转为其他字符串格式:

ret=str.encode(“gb2312”)
ret=str.encode("ascii")
ret=str.encode("utf-8")

 

chardef判断字符串为何种编码格式:

encode = chardef.detect(str)
print encode[encoding]

 

字符串格式化%s

print "test for %s, value is %d"%("format", 123)

 

一般在py文件开始的时候都加上#encoding=utf-8,避免文件中有中文乱码


处理字符串问题最主要是知道字符串输入的时候是什么格式,在输入的时候处理好字符串,处理过程就好办了

 

以上是关于python基础篇----字符串unicode的主要内容,如果未能解决你的问题,请参考以下文章

python3 unicod,utf-8,gbk的编码和解码中文显示问题

Python基础之--from __future__ import unicode_literals作用

JAVA SE基础篇32.String类

python基础04

Unicode 范围以及python中生成所有Unicode的方法

python基础 字符编码转换