爬虫学习笔记：爬取单张图片

Posted 2021-07-29 howard2005

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了爬虫学习笔记：爬取单张图片相关的知识，希望对你有一定的参考价值。

文章目录

一、爬取目标
- （一）网页地址
- （二）网页源码
二、实现步骤

一、爬取目标

（一）网页地址

http://www.jituwang.com/tuku/201811/1046031.html

在这里插入图片描述

（二）网页源码

在这里插入图片描述

需要爬取图像标签<img src="https://img01.jituwang.com/181117/256616-1Q11FZ20116.jpg" title="握手商务男人" alt="握手商务男人">的src和title属性值

二、实现步骤

创建Python程序 - 爬取单张图片.py

（一）导入案例所需库

在这里插入图片描述

（二）定义待爬取的网页地址

在这里插入图片描述

（三）模拟发送请求，获取网页内容

在这里插入图片描述

运行程序，查看结果

（四）规则提取数据 - 待爬取图片的标题与网址

在这里插入图片描述

查看源代码，class属性为viewMainPad的div有三个，包含待爬取图片的div是第二个，因此html.xpath("//div[@class='viewMainPad']")[1]，列表下标是从0开始计数的。
运行程序，查看结果

（五）下载爬取的图片并保存到本地

在这里插入图片描述

运行程序，查看结果
查看爬取的图片

以上是关于爬虫学习笔记：爬取单张图片的主要内容，如果未能解决你的问题，请参考以下文章

Python3网络爬虫：这个帅哥肌肉男横行的世界（爬取帅哥图）

Python——网络爬虫（爬取网页图片）

2023爬虫学习笔记 -- 使用代理爬取数据

小爬虫学习——使用 requests 爬取百度图片

最网最全python框架--scrapy（体系学习，爬取全站校花图片），学完显著提高爬虫能力（附源代码），突破各种反爬

python爬虫-爬取盗墓笔记