爬虫学习笔记:爬取单张图片

Posted howard2005

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫学习笔记:爬取单张图片相关的知识,希望对你有一定的参考价值。

一、爬取目标

(一)网页地址

http://www.jituwang.com/tuku/201811/1046031.html

在这里插入图片描述

(二)网页源码

在这里插入图片描述

  • 需要爬取图像标签<img src="https://img01.jituwang.com/181117/256616-1Q11FZ20116.jpg" title="握手商务男人" alt="握手商务男人">srctitle属性值

二、实现步骤

  • 创建Python程序 - 爬取单张图片.py

(一)导入案例所需库

在这里插入图片描述

(二)定义待爬取的网页地址

在这里插入图片描述

(三)模拟发送请求,获取网页内容

在这里插入图片描述

  • 运行程序,查看结果
    在这里插入图片描述

(四)规则提取数据 - 待爬取图片的标题与网址

在这里插入图片描述

  • 查看源代码,class属性为viewMainPad的div有三个,包含待爬取图片的div是第二个,因此html.xpath("//div[@class='viewMainPad']")[1],列表下标是从0开始计数的。
    在这里插入图片描述
  • 运行程序,查看结果
    在这里插入图片描述

(五)下载爬取的图片并保存到本地

在这里插入图片描述

  • 运行程序,查看结果
    在这里插入图片描述
  • 查看爬取的图片
    在这里插入图片描述

以上是关于爬虫学习笔记:爬取单张图片的主要内容,如果未能解决你的问题,请参考以下文章

Python3网络爬虫:这个帅哥肌肉男横行的世界(爬取帅哥图)

Python——网络爬虫(爬取网页图片)

2023爬虫学习笔记 -- 使用代理爬取数据

小爬虫学习——使用 requests 爬取百度图片

最网最全python框架--scrapy(体系学习,爬取全站校花图片),学完显著提高爬虫能力(附源代码),突破各种反爬

python爬虫-爬取盗墓笔记