爬虫5 cookie的使用

Posted leafchen

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫5 cookie的使用相关的知识,希望对你有一定的参考价值。

简述:cookie, 用户登录某网站时的登录信息,记录本地浏览器中。在访问其它需要此用户的页面时,可以通过cookie信息来登录验证。

  1. 爬虫直接使用cookie信息访问页面

"""cookie, 网页端存储用户登录信息等数据, 在其他页面需要时提供
    1. 直接使用浏览器中查到的cookie,进行验证
    2. 记录用户登录信息,使用登录信息来验证
"""

from urllib.request import Request, urlopen
from fake_useragent import UserAgent


# url = ‘https://account.cnblogs.com/signin‘
url = https://home.cnblogs.com/u/leafchen/detail/
headers = {
    User-Agent: UserAgent().chrome,
    Cookie: ...
}
request = Request(url, headers=headers)
response = urlopen(request)
info = response.read()
print(info.decode())

 

以上是关于爬虫5 cookie的使用的主要内容,如果未能解决你的问题,请参考以下文章

scrapy按顺序启动多个爬虫代码片段(python3)

网络爬虫-爬取拉勾网不成功,登录设置cookie

Urllib库基本使用详解(爬虫,urlopen,request,代理ip的使用,cookie解析,异常处理,URL深入解析)

js代码片段: utils/lcoalStorage/cookie

python爬虫爬取豆瓣影评返回403怎么办,代理IP和cookie都设置了

Selenium用法详解cookies操作JAVA爬虫