如何使用 Guava 取消转义 HTML 实体?

Posted

技术标签:

【中文标题】如何使用 Guava 取消转义 HTML 实体?【英文标题】:How can I unescape HTML entities using Guava? 【发布时间】:2012-04-14 15:48:36 【问题描述】:

我似乎无法为此找到正确的文档。 Apache 有一个 unescapehtml 方法,我确信 Guava 也有类似的方法。

【问题讨论】:

像***.com/questions/4542550/… 这样的问题让我相信我可以用番石榴代替我对 apache 库的使用。 【参考方案1】:

需要“手动”取消转义通常是一个强烈的信号,表明您没有使用合适的工具/框架来满足您更高级别的需求。你想做什么?

【讨论】:

我正在借助 Jsoup/goose 从 HTML 页面中提取元数据。你知道另一个可以做 html 实体解析的 html 解析器吗? 试着问一个标有“jsoup”和“goose”的问题,然后解释你在这里真正想要做什么。那个(那些?)API 不应该让你引入另一个第三方库只是为了进行转义,这是他们应该擅长的。

以上是关于如何使用 Guava 取消转义 HTML 实体?的主要内容,如果未能解决你的问题,请参考以下文章

如何转义 HTML 或取消转义 HTML?

如何取消转义html字符串中的引号

如何转义 HTML 但不转义字符实体?

如何在 C 中解码 HTML 实体?

为啥html,xml的特殊符号转义不用斜杠,而要用& quot ;这样的奇怪形式?

转义字符HTML 字符实体< &gt: &等