最近想把模拟登录的知识学习下,所以就进行了豆瓣账号的简单登录,以下是代码:
# -*- coding:utf-8 -*- ‘‘‘豆瓣模拟登陆,并实现发一条状态‘‘‘ import requests session = requests.session() header = {"Host": "www.douban.com", "Referer": "https://www.douban.com/", "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:58.0) Gecko/20100101 Firefox/58.0" } def login(): print("====start====") username = input("please input your 账号:") password = input("please input your 密码:") payload = { "captcha-id": "", "captcha-solution":"", "form_email":username, "form_password":password, "source": "index_nav", "user_login": "登录" } # 通过验证码的获取得到验证码的图片和id rc = requests.get("https://www.douban.com/j/misc/captcha", headers=header) captchaUrl = rc.json()[‘url‘] captchaid = rc.json()[‘token‘] ri = requests.get("https:"+captchaUrl, headers=header) with open(‘captcha.jpg‘, "wb") as fc: fc.write(ri.content) payload["captcha-id"] = captchaid payload["captcha-solution"] = input("please input captcha code:") # 通过用户名密码登录豆瓣账号,并检查返回的html中是否有账号名称,如果有则说明成功了 rl = session.post("https://accounts.douban.com/login", headers=header,data=payload) if "ven忘了" in rl.text: print("login in success!") else: print("login in failure!") # session保持登录状态,在首页实现发布状态。 payload2 = { "ck": "oAEg", "comment":"今天的天气是真的好,万里无云,四季常青!" } rm = session.post("https://www.douban.com/", headers=header,data=payload2) print("success") login()
实现豆瓣的模拟登录,最关键的当然是要观察豆瓣账户是如何登录的,(在谷歌或者火狐浏览器中,实现一次登录,抓取登录时发送的包(是一个post的请求)),如下:
我们需要把参数中的值加入到请求当中去,然后headers的设定必不可少,使用session可以保持登录的状态,以便下一步实现对个人主页上的操作。
注:实现的内容比较简单,但是我觉得比较重要。如有疑问请私信我,也请大神指点。