抓取页面上的email邮箱
Posted 陌上花开
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抓取页面上的email邮箱相关的知识,希望对你有一定的参考价值。
#!/usr/bin/python #-*- coding:utf-8 -*- import requests import re def get_email(url): """get all the email address from the url""" content = requests.get(url).text pattern = r‘[0-9a-zA-Z._][email protected][0-9a-zA-Z._]+\.[0-9a-zA-Z._]+‘ p = re.compile(pattern) m = p.findall(content) with open(‘emil.txt‘, ‘a‘) as f: for mm in m: f.write(mm+‘\n‘) ‘‘‘‘‘ with open(‘tmp.html‘, ‘w‘) as f: f.writelines(content) ‘‘‘ if __name__==‘__main__‘: get_email(‘https://www.aliyun.com/jiaocheng/442063.html‘)
以上是关于抓取页面上的email邮箱的主要内容,如果未能解决你的问题,请参考以下文章