Python爬虫电话号码批量数据爬取
Posted 不加班的程序员丶
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫电话号码批量数据爬取相关的知识,希望对你有一定的参考价值。
主要代码详解:
headers 浏览头部信息设置,也可以设置多个,达到伪装headers模拟不同浏览器访问的目的。
requests. get 构造请求 get方法获取html网页内容代码,以文本形式保存在response中。
观察页面对应名称以及号码信息格式,用pat1筛选名称,pat2筛选号码资料,其中(.*?)为所获取的信息资料;[\\s\\S]表示任何字符,*?则表示多个字符(不限个数),两者组合起来就是多个任意字符。re. compile将正则表达式字符串编译为pattern实例,data1和data2是用findall寻找网页代码中实例的所有匹配项,再定义一个resultlist列表来存储这些信息,用for循环将对应的名称和号码匹配下来,实现名称与号码的一一对应。如下图:
以上就是爬取出来的号码数据内容,如果有不懂的可以评论我会尽量描述详细一点。此外,还可以用换行字符实现列表中一个字符串一行,更便于浏览,可以自己修改下代码试一下哦。
需要相关爬虫资料的可以在添加微信ssmp5558 备注【666】
以上是关于Python爬虫电话号码批量数据爬取的主要内容,如果未能解决你的问题,请参考以下文章