抓取一个html标签,只留下内容

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了抓取一个html标签,只留下内容相关的知识,希望对你有一定的参考价值。

Developed for eclipse but prolly useful elsewhere, put the text after 'find' in the 'find' box and the text after 'replace' in 'replace'.

Note: this example uses an html list item 'li', make sure to replace that with the tag you want to find
  1. Find: <(li*)\b[^>]*>(.*?)</\1>
  2. Replace: $2

以上是关于抓取一个html标签,只留下内容的主要内容,如果未能解决你的问题,请参考以下文章

Java selenium 抓取元素的整个 html 内容

如何抓取 HTML 标签的内容?

前端SEO优化

删除标签(和标签内容)但留下文字

如何用Python爬取出HTML指定标签内的文本?

如何用python抓取这个网页的内容?