python爬虫 url链接编码成gbk2312格式

Posted 编程人生改变命运

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python爬虫 url链接编码成gbk2312格式相关的知识,希望对你有一定的参考价值。

1. 问题  抓取某个网站,发现请求参数是乱码格式,

 

    

 

     这是点击 TextView,发现请求参数如下图所示

    

 

 3. 那么=%B9%FA%CE%F1%D4%BA%B7%A2%D5%B9%D1%D0%BE%BF%D6%D0%D0%C4是什么东西啊

  

 

     解码后是   =国务院发展研究中心

代码实现:

content = "我爱中国"
import urllib
res = urllib.quote(content.encode(\'gb2312\'))
print res
print "11111111", type(res)

  

 

以上是关于python爬虫 url链接编码成gbk2312格式的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫把url链接编码成gbk2312格式过程解析

用JS将URL中的汉字编码成GBK,怎么弄?

node爬虫解决网页编码为gb2312结果为乱码的方法

python爬虫出现菱形问号乱码的解决方法

Sublime使用

使用python进行URL编码,爬虫时解决参数乱码的问题