Jsoup 删除嵌套标签但保留文本

Posted

技术标签:

【中文标题】Jsoup 删除嵌套标签但保留文本【英文标题】:Jsoup remove nested tags but keep text 【发布时间】:2012-08-17 13:10:15 【问题描述】:

我在一组元素中有 html,所以可能还有其他类似的项目

<b><a title="San Francisco/Twin Peaks-Lake Merced">Twin Peaks</a></b>

但我想像这样用 jsoup 清理它

<b>Twin Peaks</b>

使用白名单会是最好的主意吗?

【问题讨论】:

【参考方案1】:

很抱歉弄乱了***,但是 unwrap 解决了这个问题。

document.select("a").unwrap()

【讨论】:

以上是关于Jsoup 删除嵌套标签但保留文本的主要内容,如果未能解决你的问题,请参考以下文章

如何将动态XML中的嵌套标签转换为for循环?

不解释带有文本和变量的嵌套标签

如何在 VBA 中获取标签的内部文本,不包括嵌套标签中的文本?

HTMLHTML 标签 ① ( 骨架标签 | 双标签和单标签 | 嵌套关系和并列关系 | 文档类型 | 页面语言 | 编码字符集 )

如何在没有标签的情况下选择 HTML 标签中的文本(JSoup)

如何在swift 3中使用imageview嵌套标签