python使用bs4模块 去除html标签字符串方法

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python使用bs4模块 去除html标签字符串方法相关的知识,希望对你有一定的参考价值。

使用bs4模块 去除html标签方法

from bs4 import BeautifulSoup

s = ‘‘‘ 
/usr/sbin/tgt-admin <span class="token comment">#配置工具</span>
/usr/sbin/tgtadm  <span class="token comment">#管理target工具</span>
/usr/sbin/tgtd  <span class="token comment">#服务进程程序</span>
/usr/sbin/tgtimg <span class="token comment">#共享的映射文件设备工具</span></code></pre><div class="toolbar"></div></div>
‘‘‘‘
b = BeautifulSoup(s,"html.parser") #html.parser 是一个固定的值,是一个解析器

print(b.text)

以上是关于python使用bs4模块 去除html标签字符串方法的主要内容,如果未能解决你的问题,请参考以下文章

Python库-BeautifulSoup

python爬虫rp+bs4

Python:使用正则去除HTML标签(转)

Python 爬虫--数据解析(bs4方法)

python bs4分析html时,怎么找到最底层的某个标签

python3实践-从网站获取数据(Carbon Market Data-GD) (bs4/Beautifulsoup)