Python3获取新浪微博内容乱码问题

Posted 乡间小路

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python3获取新浪微博内容乱码问题相关的知识,希望对你有一定的参考价值。

用python获取新浪微博最近发布内容的时候调用 public_timeline()函数的返回值是个jsonDict对象,首先需要将该对象通过json.dumps函数转换成字符串,然后对该字符串用GBK进行编码和解码,注意编码的时候函数encode的第二个参数要使用ignore(默认是strict),以防止当解码错误的时候报错而使程序意外退出 。

import webbrowser
import sinaweibopy3  
from time import sleep
import json
def getLotsOfWeibo(searchStr):
    APP_KEY=‘你的key‘
    APP_SECRET=‘你的密码‘
    REDIRECT_URL=‘https://api.weibo.com/oauth2/default.html‘
    client=sinaweibopy3.APIClient(app_key=APP_KEY,app_secret=APP_SECRET,redirect_uri=REDIRECT_URL)
    url = client.get_authorize_url()
    print(url)
    webbrowser.open_new(url)
    result = client.request_access_token(
            input("please input code : "))  # Enter the CODE obtained in the authorized address
    print(result)
    client.set_access_token(result.access_token, result.expires_in)
    t=client.public_timeline()
    t1=json.dumps(t,ensure_ascii=False)
    t1=t1.encode(‘gbk‘,‘ignore‘).decode(‘gbk‘)#采用GBK打印,忽略编码错误否则会报错
    print (t1)  # get the latest public Weibo
来源:我的个人博客

以上是关于Python3获取新浪微博内容乱码问题的主要内容,如果未能解决你的问题,请参考以下文章

新浪微博内容自动删除

新浪微博客户端(55)-高亮显示微博内容中的昵称,话题,超链接

如何使用爬虫一键批量采集新浪微博内容

新浪微博客户端(58)-处理点击微博内容中的关键字

新浪微博客户端(56)-拼接微博内容中的昵称,超链接,表情图片

php [getUserTimelineInfo]获取用户时间线微博内容#电影业务