handle_data()返回什么?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了handle_data()返回什么?相关的知识,希望对你有一定的参考价值。
我尝试使用html.parser中的handle_data()从网页中获取仅有意义上下文的列表(我的测试代码中只有两行网页内容),但是得到了多个不在列表中的列表。我不明白handle_data()返回什么。有人可以帮我吗?如何将它们仅存储在一个列表中?
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
def handle_data(self, data):
a = []
for i in data.split():
a.append(i)
print(a)
return a
parser = MyHTMLParser()
parser.feed('<html><head><title>Test</title></head><body><h1>Parse me!</h1></body></html>')
结果:['测试'][“解析”,“我!”]
答案
每次解析器在html标记内发现文本/内容时,都会调用HTMLparser的handle_data
方法。
另一答案
据我所知http.parser
是低级模块,它可以帮助解析HTML,但不返回任何内容。您必须决定如何处理数据。您可以打印它或放入一些变量或创建树等。但这需要编写所有将返回任何内容的代码。
以上是关于handle_data()返回什么?的主要内容,如果未能解决你的问题,请参考以下文章