Jsoup 删除嵌套标签但保留文本
Posted
技术标签:
【中文标题】Jsoup 删除嵌套标签但保留文本【英文标题】:Jsoup remove nested tags but keep text 【发布时间】:2012-08-17 13:10:15 【问题描述】:我在一组元素中有 html,所以可能还有其他类似的项目
<b><a title="San Francisco/Twin Peaks-Lake Merced">Twin Peaks</a></b>
但我想像这样用 jsoup 清理它
<b>Twin Peaks</b>
使用白名单会是最好的主意吗?
【问题讨论】:
【参考方案1】:很抱歉弄乱了***,但是 unwrap 解决了这个问题。
document.select("a").unwrap()
【讨论】:
以上是关于Jsoup 删除嵌套标签但保留文本的主要内容,如果未能解决你的问题,请参考以下文章
如何在 VBA 中获取标签的内部文本,不包括嵌套标签中的文本?
HTMLHTML 标签 ① ( 骨架标签 | 双标签和单标签 | 嵌套关系和并列关系 | 文档类型 | 页面语言 | 编码字符集 )