python之cookie使用

Posted fjc0000

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之cookie使用相关的知识,希望对你有一定的参考价值。

cookie是web主机服务器返回给客户端登陆信息的一种密钥。在爬虫时,对于需要登陆账号密码的网站,若不使用cookie,则不能获取需要的信息。当使用cookie时,客户端可以多次直接获取服务器网页信息,不必重复登陆自己的账号密码。cookie的使用分为两种,第一种:将cookie放在header信息里面,采用post的请求方式,进行网页信息的获取。例如:

import urllib.request,urllib.parse
url=http://****com/
headers={user-agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36,
         cookie:************H_PS_PSSID=1421_21122_26350_28413; BDSFRCVID=kY-OJeC62uipAp69jB0prglYsg5rbsOTH6aV1uteHfFNlQlK3xZmEG0PeM8g0KubhaS4ogKKBeOTHn0F_2uxOjjg8UtVJeC6EG0P3J; H_BDCLCKID_SF=tJPDVI82JCD3j-5cbjAWq4tehHRWXCr9WDTm_Doa24JNqKLwMxK2KbDshbreK5QHKj79-pPKKxLaftbNy-jPX4Auh-4ehpTL3mkjbn5zfn02OP5PM-Q6j-4syPRGKxRnWI_jKfA-b4ncjRcTehoM3xI8LNj405OTt2LE3-oJqCLMbDIR3D; delPer=0; PSINO=2; ZD_ENTRY=baidu; PHPSESSID=eeoser3pl2vivvnbgn14bad960; Hm_lvt_4010fd5075fcfe46a16ec4cb65e02f04=1550109976,1550112542; BDUSS=NKTVZMQTNOZzNvVXB5bTIySDluNUFpelVNYnBMMW5EU1hTSjhOQnk1Sm9aSXhjQUFB****,
         connection:keep-alive,
         accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8}

request=urllib.request.Request(url,headers=headers)
w=urllib.request.urlopen(request).read()
print(w.decode())

可以直接爬取自己账号下该网站的信息。这种方式最简单,但不实用,需要手动输入cookie信息,cookie信息的获取不介绍,打开所需要的网站,F12,F5即可查看cookie,host等headers信息。

目前主流的是将cookie信息保存到自己的客户端,然后通过调取该文件,进行爬虫。即第二种方法:



以上是关于python之cookie使用的主要内容,如果未能解决你的问题,请参考以下文章

python之cookie使用

爬虫案例之网易有道翻译Python代码改写

Python爬虫入门之Cookie的使用

2Python全栈之路系列之Tornado的Cookie与Sess

Python爬虫常用之登录 思想

python之requests模块-cookie