寒假一(爬虫)
Posted zjm15511858030
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了寒假一(爬虫)相关的知识,希望对你有一定的参考价值。
在爱网上自己学习爬虫,并进行了一个实践。网站取自于https://www.bilibili.com/video/av75562300?from=search&seid=11774811603250332545
针对于https://vmgirls.com网站,对其一个子网站进行了爬去
采用requests方法,从网站前台获取网站的布局以及信息
由于网站有自我保护,获取到的网站信息为:
由于header的缘故,我选择使用网站本身的header
其代码为:
为了防止爬取网站图片的时候网站奔溃掉,选择了使用time包
将时间调整为一秒钟爬取一次
调用re的findall方法利用正则表达式,将图片全部保存下来
最后成功将图片保存在一个文件夹下
以上是关于寒假一(爬虫)的主要内容,如果未能解决你的问题,请参考以下文章