如何删除字符串的 HTML 元素? [复制]

Posted

技术标签:

【中文标题】如何删除字符串的 HTML 元素? [复制]【英文标题】:How to remove HTML element of String? [duplicate] 【发布时间】:2014-01-27 14:38:33 【问题描述】:

我想在 Java 中删除字符串的 html

<hr><b><strong>Task Details</strong></b><hr><b>Date Created: </b> 01/06/2014 07:55pm<br><b>Date Modified: </b> 01/06/2014 07:55pm<br><b>Assigned to: </b> Administrator<br><b>Created By: </b> Administrator<br><b>Status: </b> Not Started<br><b>Description: </b> Test Description<br>.

上面是我的字符串,我想删除 HTML 标签。

【问题讨论】:

这些是 HTML 标签吗?输入似乎没有 HTML 标记。 问题不够清楚。你在说什么字符串和什么 HTML 标签?您能否详细说明问题并提及您到底想要实现什么? 'Java' 对应于 'javascript' 就像 'Car' 对应于 'Carpet'。那么您使用的是哪种语言? 我只是将 [java] 和 [javascript] 都留在问题中,直到您弄清楚您使用的是哪种语言...请相应地重新标记它。 【参考方案1】:

也许这会起作用:

String noHTMLString = htmlString.replaceAll("\\<.*?>","");

它使用正则表达式来删除字符串中的所有 HTML 标签。

更具体地说,它会从字符串中删除所有类似 XML 的标签。因此,即使 不是有效的 HTML 标记,它也会被删除。但它对大多数意图和目的都有好处。

希望这会有所帮助。

Jsoup. 这实际上非常简单

public static String html2text(String html) 
    return Jsoup.parse(html).text();

【讨论】:

-1 从this earlier answer 复制逐字未署名的答案的第一部分“希望对您有帮助”。除非你是同一个海报,否则这是一个很大的网络礼仪禁忌。【参考方案2】:

您可以使用 Jsoup 库。

String str="<h3>My Text</h3>";
System.out.println(Jsoup.parse(str).text());

上面的代码去掉了所有的htms标签,并留下文本作为输出

【讨论】:

以上是关于如何删除字符串的 HTML 元素? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何根据另一个列表的内容删除一个列表中的列表元素? [复制]

我把火狐删了又重装了,之前的收藏夹如何恢复

如何在 javascript 数组中编写 html 的锚元素? [复制]

如何在python中删除html标签中的文本? [复制]

如何使用jQuery删除html字符串中的元素

从字符串指针数组中删除一个元素