python去除html标签的几种方法

Posted 超级英雄拯救世界之前成长的日子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python去除html标签的几种方法相关的知识,希望对你有一定的参考价值。

import re
from bs4 import BeautifulSoup
from lxml import etree

html = ‘<p>你好</p><br/><font>哈哈</font><b>大家好</b>‘

# 法一
pattern = re.compile(r‘<[^>]+>‘,re.S)
result = pattern.sub(‘‘, html)
print(result)
 
# 法二 soup = BeautifulSoup(html,‘html.parser‘) print(soup.get_text()) # 法三 response = etree.HTML(text=html) # print(dir(response)) print(response.xpath(‘string(.)‘)) # 你好哈哈大家好 # 你好哈哈大家好 # 你好哈哈大家好

  


以上是关于python去除html标签的几种方法的主要内容,如果未能解决你的问题,请参考以下文章

a标签调用js的几种方法

去除inline-block间隙的几种方法

Java中去除字符串中所有空格的几种方法

Laravel:如何在控制器的几种方法中重用代码片段

Java中去除字符串中所有空格的几种方法

关于iOS去除数组中重复数据的几种方法