Python爬虫电话号码批量数据爬取

Posted 不加班的程序员丶

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫电话号码批量数据爬取相关的知识,希望对你有一定的参考价值。

 主要代码详解:

 

 headers  浏览头部信息设置,也可以设置多个,达到伪装headers模拟不同浏览器访问的目的。

 requests. get  构造请求  get方法获取html网页内容代码,以文本形式保存在response中。

     观察页面对应名称以及号码信息格式,用pat1筛选名称,pat2筛选号码资料,其中(.*?)为所获取的信息资料;[\\s\\S]表示任何字符,*?则表示多个字符(不限个数),两者组合起来就是多个任意字符。re. compile将正则表达式字符串编译为pattern实例,data1和data2是用findall寻找网页代码中实例的所有匹配项,再定义一个resultlist列表来存储这些信息,用for循环将对应的名称和号码匹配下来,实现名称与号码的一一对应。如下图:

       以上就是爬取出来的号码数据内容,如果有不懂的可以评论我会尽量描述详细一点。此外,还可以用换行字符实现列表中一个字符串一行,更便于浏览,可以自己修改下代码试一下哦。

需要相关爬虫资料的可以在添加微信ssmp5558   备注【666】

 

以上是关于Python爬虫电话号码批量数据爬取的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫实践 —— 5.便民生活网电话号码爬取

Python爬虫入门案例教学:批量爬取彼岸桌面4K超清美女壁纸

如何一个月入门Python爬虫,轻松爬取大规模数据

Python爬虫学习教程,批量爬取下载抖音视频

用python爬取网页数据

爬虫练习五:多进程爬取股市通股票数据