Python爬虫实践 —— 5.便民生活网电话号码爬取

Posted allmenmustdie123

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python爬虫实践 —— 5.便民生活网电话号码爬取相关的知识,希望对你有一定的参考价值。

re简单实践

分析网页,很容易得出规律:

  css字体颜色标记电话号码

  

  代码实现:

import re
import requests

headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:71.0) Gecko/20100101 Firefox/71.0"
}
reponse = requests.get("http://changyongdianhuahaoma.51240.com/",headers=headers).text
pat1 = re.compile(r\'<tr bgcolor="#EFF7F0">[\\s\\S]*?<td>(.*?)</td>[\\s\\S]*?<td>[\\s\\S]*?</td>[\\s\\S]*?</tr>\')
pat2 = re.compile(r\'<tr bgcolor="#EFF7F0">[\\s\\S]*?<td>[\\s\\S]*?</td>[\\s\\S]*?<td>(.*?)</td>[\\s\\S]*?</tr>\')

data1 = pat1.findall(reponse)
data2 = pat2.findall(reponse)

print(data1)
print(data2)

resultlist = []
for i in range(0, len(data1)):
    resultlist.append(data1[i]+data2[i])

print(resultlist)

  最后效果:

  

以上是关于Python爬虫实践 —— 5.便民生活网电话号码爬取的主要内容,如果未能解决你的问题,请参考以下文章

python爬虫实践——爬取京东商品信息

更多查询手机号码归属地的方法?

求编程大佬 Python 爬虫

python爬虫实践

Python爬虫电话号码批量数据爬取

Python爬虫实践入门,超详细