我的爬虫入门书 —— 《Python3网络爬虫开发实战(第二版)》

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我的爬虫入门书 —— 《Python3网络爬虫开发实战(第二版)》相关的知识,希望对你有一定的参考价值。

参考技术A 年前学习python基础知识之后,在好奇心的推动下,我开始接触了python网络爬虫,而在刚开始接触网络爬虫时,繁多的资料让我猝不及防,对于习惯于优先通过书籍进行自主学习的我来说,通过长期看视频学习反而不是很习惯,但是在网络上找到的许多爬虫相关资料,不是说的过于简略,就是部分内容有些“过时”。该跟谁走?该怎么走?这个问题那段时间一直困扰着我。

所幸,在热心群友的推荐下(haha,真的很热心的一个老哥),我入手了崔大写的《Python3网络爬虫开发实战(第二版)》,找到了符合我状况的“引路书”。

初入手,书籍就令我惊讶,920页左右的厚度,在我之前买过的相关书籍中,厚度也能算是前几名,比实际想象的厚许多。

而当我翻开目录,可以发现,与学科领域的“大部头”专著相比(读过几本,看那种书真的蛮痛苦的hh),这本书的结构层次分明,由浅入深、层层递进,由爬虫基础引入,再向各方面延伸,刚好满足了我“半个小白”状态的学习需要(经过近2个月的学习感觉也确实真的适合我)。

而在书的内容之外,不得不提的是,崔大的Scrape平台。崔大的Scrape平台合理的解决了爬虫入门者实战训练的“场地”问题,防止了初步入门者无知的迈入了著作权的“灰色地带”,这种提供练习平台的爬虫教学,确实也我第一次遇到的,我对崔大的用心感到真心佩服。

   简要的介绍到这里就结束了!目前我已经跟随崔大的这本书学习了两个月,受益匪浅,掌握了蛮多的技能。

总之,如果想跟随较新的爬虫教程学习,基础跟我相似的同学,我认为崔大的《Python3网络爬虫开发实战(第二版)》是入门爬虫绝不容错过的一本书!

01-Python 零基础入门爬虫 图片爬取

01-Python 零基础入门爬虫开发-爬虫简介

一 什么是爬虫?

网络爬虫(网络蜘蛛 网络机器人)

就是模拟浏览器去访问和获取互联网上信息的一个程序

二 爬虫的分类

通用网络爬虫

百度 谷歌 雅虎... 搜索引擎

特点:关键字获取既定目标 覆盖率很大

聚焦网络爬虫

特点:到互联网上有选择有目的的去抓取特定的目标和相关的主体内容

增量式网络爬虫

特点:只采取增量式的更新或者只爬行新产生或者是已经发生变化的网页

深层网络爬虫

表层

深层 大部分内容是币可以通过静态链接获取到的,隐藏在搜索表单之后的一些数据,有可能需要用户提交一些关键词才可以获得的WEB页面

三 案例演示

聚焦网络爬虫

一个静态为主的web页面 爬取的数据表情包

每张图片都不一样 地址指向它本身 只需找到图片的地址

图片的目标网站 https://qq.yh31.com/zjbq/16100183.html

每张图片所对应的链接只需要在网页源代码中找到就可以了

                                /tp/zjbq/202004162056276094.gif 未找到图片

https://qq.yh31.com/tp/zjbq/202004162056276094.gif 可找到图片

 

以上是关于我的爬虫入门书 —— 《Python3网络爬虫开发实战(第二版)》的主要内容,如果未能解决你的问题,请参考以下文章

网络爬虫开发实战2和一的区别

《python3 网络爬虫开发实践》笔记

从python基础到爬虫的书有啥值得推荐

python3网络爬虫学习——基本库的使用

豆瓣评分 9.0,超 10 万开发者的入门选择,这本经典好书终于升级啦!

python网络爬虫可以干什么