过滤掉字符串中的锚标签

Posted

技术标签:

【中文标题】过滤掉字符串中的锚标签【英文标题】:Filtering out anchor tags in a string 【发布时间】:2010-09-06 17:35:55 【问题描述】:

我需要过滤掉字符串中的锚标记。例如,

查看这个网站:***

我需要能够过滤掉这个锚标记:

查看这个网站:http://www.***.com

这种格式也可能不是一成不变的。锚标记可能还有其他属性。此外,字符串中可能有超过 1 个锚标记。在进入数据库之前,我正在 vb.net 中进行过滤。

【问题讨论】:

【参考方案1】:

这是一个应该可以工作的简单正则表达式。

Imports System.Text.RegularExpressions

' ....

Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>")
Dim input As String = "This is a link: <a href='http://www.***.com'>***</a>"
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)

【讨论】:

以上是关于过滤掉字符串中的锚标签的主要内容,如果未能解决你的问题,请参考以下文章

过滤掉 HTML 标签并解析 python 中的实体

Javascript/jQuery - 使用正则表达式解析字符串中的主题标签,URL 中的锚点除外

JQuery追加过滤掉html之类的标签?

JS如何过滤掉table中的thead标签, 急!

php怎样过滤掉特殊字符啊 ☺

正则表达式过滤掉json字符串中的部分键值