通用爬虫和聚焦爬虫

Posted 随意随性

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了通用爬虫和聚焦爬虫相关的知识,希望对你有一定的参考价值。

爬虫分为两个领域:

聚焦爬虫和通用爬虫。

通用爬虫:

  搜索引擎用的爬虫系统。

目标:

  搜索互联网所有的信息下载下来,放到本地服务器,再对这些网页进行相关处理,提取关键字什么的,最终给用户提供一个检索的接口,他们每隔一段时间获取一次。

百度快照的好处:

  如果直接点击链接的话,可能信息已经被删除了,但是点击百度快照的话,可能还会备份的,搜索引擎的话是无法爬取图片的,电影也爬不出来。

 

聚焦爬虫:

  程序员写的针对某种内容信息的爬虫。

 

   

以上是关于通用爬虫和聚焦爬虫的主要内容,如果未能解决你的问题,请参考以下文章

通用爬虫和聚焦爬虫

通用爬虫和聚焦爬虫的概念

Python零基础入门爬虫原理与数据抓取-通用爬虫和聚焦爬虫

Python零基础入门爬虫原理与数据抓取-通用爬虫和聚焦爬虫

Python爬虫入门之一通用爬虫和聚焦爬虫

聚焦爬虫与通用爬虫的区别