在搜索引擎领域,有哪些常用的网络爬虫?

Posted 楚界科技

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在搜索引擎领域,有哪些常用的网络爬虫?相关的知识,希望对你有一定的参考价值。

网络爬虫也有人叫做网络蜘蛛。

Web Spider,是一个很形象的名字,把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。但业界内很少叫蜘蛛的,一般都叫做网络爬虫,Spider只是个别爬虫的名称。

网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。

不同的搜索引擎有着各自的爬虫,以下是一些我们经常接触到的爬虫程序。

1.    百度爬虫:Baiduspider,包括Baiduspider-image(抓取图片)、Baiduspider-mobile(抓取wap)Baiduspider-video(抓取视频)、Baiduspider-news(抓取新闻)

2.    谷歌爬虫:Googlebot

3.    360爬虫:360Spider

4.    搜狗爬虫:Sogou News Spider。

5.    搜狗爬虫还包括如下这些:Sogou web spider、Sogou inst spider、Sogou spider2、Sogou blog、Sogou News Spider、Sogou Orion spider

6.    SOSO爬虫:Sosospider

7.    雅虎爬虫:Yahoo! Slurp China

8.    有道爬虫:YoudaoBot或者YodaoBot

9.    MSN爬虫:msnbot-media

10.  必应爬虫:bingbot。

11.   一搜爬虫:YisouSpider。

12.  Alexa爬虫:ia_archiver。

13.  宜搜爬虫:EasouSpider。

14.  即刻爬虫:JikeSpider。

 


以上是关于在搜索引擎领域,有哪些常用的网络爬虫?的主要内容,如果未能解决你的问题,请参考以下文章

爬虫技术的商业用途

网络爬虫软件有哪些比较知名的?

Python如何用在网络爬虫领域

Python --- 网络爬虫

Python网络爬虫

网络爬虫技术有哪些用途和危害?