python使用bs4模块 去除html标签字符串方法
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python使用bs4模块 去除html标签字符串方法相关的知识,希望对你有一定的参考价值。
使用bs4模块 去除html标签方法
from bs4 import BeautifulSoup
s = ‘‘‘
/usr/sbin/tgt-admin <span class="token comment">#配置工具</span>
/usr/sbin/tgtadm <span class="token comment">#管理target工具</span>
/usr/sbin/tgtd <span class="token comment">#服务进程程序</span>
/usr/sbin/tgtimg <span class="token comment">#共享的映射文件设备工具</span></code></pre><div class="toolbar"></div></div>
‘‘‘‘
b = BeautifulSoup(s,"html.parser") #html.parser 是一个固定的值,是一个解析器
print(b.text)
以上是关于python使用bs4模块 去除html标签字符串方法的主要内容,如果未能解决你的问题,请参考以下文章
python bs4分析html时,怎么找到最底层的某个标签
python3实践-从网站获取数据(Carbon Market Data-GD) (bs4/Beautifulsoup)