python 处理html文本的中文字符gbk转utf-8

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 处理html文本的中文字符gbk转utf-8相关的知识,希望对你有一定的参考价值。

#中文字符gbk转utf-8
    def gbk2utf8(self,raw):
        rs=raw.encode(‘raw_unicode_escape‘) #转为机器识别字符串
        s=repr(rs)
        ss=unicode(eval(s),"gbk")     #gbk解码为unicode
        utf8_str=ss.encode(‘utf-8‘)    #unicode编码为utf-8
        return utf8_str

  

以上是关于python 处理html文本的中文字符gbk转utf-8的主要内容,如果未能解决你的问题,请参考以下文章

python字符转码

Python json unicode转中文

Python 之 字符转编码操作

Python字符串

python2.7 字符处理小节

Python 基础 - Day 2 Learning Note - 字符转编码操作