用html.parser抓网页中的超链接,返回list

Posted Xiao|Deng

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了用html.parser抓网页中的超链接,返回list相关的知识,希望对你有一定的参考价值。

#python3


from
html.parser import HTMLParser class MyHTMLParser(HTMLParser): """ 1、tag是的html标签,attrs是标签的属性 2、抓网页中的超链接,返回list 3、抓网页标题, 4、handle_data:处理数据,就是<xx>data</xx>中间的那些数据 """ def __init__(self): HTMLParser.__init__(self) self.links=[] def handle_starttag(self, tag, attrs): if tag=="a": for key,value in attrs: if key=="href" and "http:" in value: self.links.append(value) data="""html页面的源码""" #初始化类MyHTMLParser parser=MyHTMLParser() #喂养,塞html页面的代码进去,会返回一个class类 parser.feed(data) #操作类方法和属性 print(parser.links)#操作属性

 

以上是关于用html.parser抓网页中的超链接,返回list的主要内容,如果未能解决你的问题,请参考以下文章

【急】【狗不答问题】点击网页中的超链接按钮没用是怎么回事? 赏金:200

115sha1链接怎么使用?

如何使用PDF编辑器的超链接工具?

如何使用PDF编辑器的超链接工具?

android中,如何屏蔽WebView里的超链接?

handle_data()返回什么?