python学习模拟登陆网站

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python学习模拟登陆网站相关的知识,希望对你有一定的参考价值。


一、通过post方式模拟登录

post方式登录网站,需要先将必要信息填充到一个dict中,例如:

Data={‘username’:username,’password’:password}


二、这里有几个问题:

1、是我怎么知道需要哪些信息填写到dict中呢?

2、是我怎么知道需要post的地址url是哪个呢?


举例分析:

对于这两个问题,以豆瓣为例。

首先打开豆瓣的登录页面

技术分享


可以看到需要post的地址就是url=’http://account.douban.com/login’;

那么需要哪些数据进行post呢?

1、使用firefox浏览器,里面有一个工具叫httpfox

2、如果不是使用Firefox浏览器,可以下载一个软件叫fiddler。

下面我将以httpfox工具讲述如何知道需要post的数据。

我们先打开httpfox。

技术分享


然后在登录页面填写账号密码。再点击登录


技术分享


点击登录之后去查看httpfox,找到一个Method是post的一行,点击它(点击登录前建议先清空httpfox列表)。

技术分享


然后点击POST Data

技术分享


然后就可以看到需要post哪些数据了。对于login那个乱码,我们可以忽略它,然后我们就可以填写post报头了。


三、更详细的抓包工具——fiddler

1、打开软件,进行实时监控,手动登陆一次,再分析抓到的包

2、第一个图是get的记录

技术分享

第二个图是POST的记录,需要从中分析我们需要的数据

获取:

User-Agent
Referer

技术分享

第三个图获取,需要POST的data,一般是用户名、密码的name格式;

技术分享


四、案例代码

#encoding=utf-8

#!/usr/bin/python

import HTMLParser
import urlparse
import urllib
import urllib2
import cookielib
import string
import re

hosturl = ‘https://www.woshidai.com/login/‘ ##自己填写
#post数据接收和处理的页面(我们要向这个页面发送我们构造的Post数据)
posturl = ‘https://www.woshidai.com/login/‘ ##从数据包中分析出,处理post请求的url

#设置一个cookie处理器,它负责从服务器下载cookie到本地,并且在发送请求时带上本地的cookie
cj = cookielib.LWPCookieJar()
cookie_support = urllib2.HTTPCookieProcessor(cj)
opener = urllib2.build_opener(cookie_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)

#打开登录主页面(他的目的是从页面下载cookie,这样我们在再送post数据时就有cookie了,否则发送不成功)
h = urllib2.urlopen(hosturl)

#构造header,一般header至少要包含一下两项。这两项是从抓到的包里分析得出的。
headers = {‘User-Agent‘ : ‘Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36‘,
           ‘Referer‘ : ‘https://www.woshidai.com/‘}
#构造Post数据,他也是从抓大的包里分析得出的。
postData = {‘app‘ : ‘login‘,
            ‘act‘ : ‘ajaxLogin‘,
            ‘mobile‘ : ‘15212345678‘, ##你的用户名
            ‘password‘ : ‘wdl‘, ##你的密码,密码可能是明文传输也可能是密文,如果是密文需要调用相应的加密算法加密

            }

#需要给Post数据编码
postData = urllib.urlencode(postData)

#通过urllib2提供的request方法来向指定Url发送我们构造的数据,并完成登录过程
request = urllib2.Request(posturl, postData, headers)
print request
response = urllib2.urlopen(request)
text = response.read()
print text


五、登陆返回语


抓取返回语,判断登陆是否成功

{"success":1,"msg":"登录成功。","data":{"from_type":""}}

{"success":0,"msg":"用户名密码错误。","data":false}




本文出自 “seeworld” 博客,请务必保留此出处http://devops2016.blog.51cto.com/4205997/1865006

以上是关于python学习模拟登陆网站的主要内容,如果未能解决你的问题,请参考以下文章

通过抓包,实现Python模拟登陆各网站,原理分析!

Python爬虫实例网站模拟登陆

Python模拟登陆练习——imooc.com登陆

Python爬虫实战:模拟登录淘宝网站

Python模拟登陆万能法

python 2.7 简单模拟登陆网站