python-利用豆瓣爬虫发个动态

Posted 2020-10-20 AuBuCuo

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python-利用豆瓣爬虫发个动态相关的知识，希望对你有一定的参考价值。

目前总的来说是失败了。原因可能是因为豆瓣验证码的问题，因为我看不到登录时候的界面，所以没法分析验证码的链接。（我用自己的浏览器登录都是默认不要验证码的，这就尴尬了），所以登录不上，后面的post也就没有意义了。把代码贴出来。

# -*- coding: utf-8 -*-
"""
Created on Sat Jan  6 14:45:40 2018

@author: xglc
"""
import requests
import time

session = requests.session() #创建request对象 

def _login(iddata):
    url = \'https://www.douban.com/accounts/login\'
    login_header = {
            \'User-Agent\':\'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/55.0.2883.87 Safari/537.36\',
            \'Origin\':\'https://www.douban.com/accounts/login\',
    }
    session.headers.update(login_header)
    session.post(url,data=iddata,headers=session.headers)
#_login()
#print(session.headers.items)

def _saysth(say_data):
    url = \'https://www.douban.com/\'
    add_headers = {\'Cache-Control\':\'max-age=0\',
                   \'Content-Length\':\'20\',
                   \'Content-Type\':\'application/x-www-form-urlencoded\'
            }
    session.headers.update(add_headers)
    session.post(url,data=say_data,headers=session.headers)

if __name__ == \'__main__\':  
    iddata = {\'form_mail\':\'账号\',
              \'form_password\':\'密码\',
              \'redir\':\'https://www.douban.com\',
              \'login\':\'登录\',
              }
    _login(iddata)
    print (\'_login\')
#    print (session.headers.items)
    for i in range(5):
        print(5-i)
        time.sleep(1)
    say_data = {\'ck\':\'OJop\',
                \'comment\':\'vict\',
                }
    _saysth(say_data)
    print(\'完成！\')

View Code

也不打算继续扣了，因为用的是自己平时用的账号，post 太多豆瓣别把我给封了？如果继续扣的话，大概方向有两点：

找出豆瓣验证码的链接（我手动登录完全看不到验证码，这是我的常用电脑，所以无法分析）
完善update一下headers的内容，那里还有一些需要修改的项。

这几天淮南雪都开始化了，零下5度，made，空调还给我偶尔出冷风，需要赶紧上班去办公室温暖一下。

手动分析豆瓣js查看：

Python-关于豆瓣发布“说句话”，添加网页等的js行为分析

以上是关于python-利用豆瓣爬虫发个动态的主要内容，如果未能解决你的问题，请参考以下文章