如何使用c#从文本中删除html标签[重复]

Posted

技术标签:

【中文标题】如何使用c#从文本中删除html标签[重复]【英文标题】:How to remove html tags from text using c# [duplicate] 【发布时间】:2014-11-26 07:18:12 【问题描述】:

我有这样的字符串

<p>There was a <b>.NET</b> programmer and he stripped the <i>html</i> tags.</p><br> </br>

如何从给定的字符串中删除那些 html 标签

【问题讨论】:

使用 HTML 处理库,例如 HTML Agility Pack 见***.com/questions/19523913/… 【参考方案1】:

使用Htmlagilitypack

var document = new HtmlDocument();
document.LoadHtml(data);
string text= document.DocumentNode.InnerText;

【讨论】:

感谢它的工作感谢 rjv......【参考方案2】:

你可以使用 Regex.Replace 这样的事情就可以了

var input = "<p>There was a <b>.NET</b> programmer and he stripped the <i>HTML</i> tags.</p><br> </br>";
var filtered = System.Text.RegularExpressions.Regex.Replace(input, "<.*?>", "");
Console.WriteLine(filtered);

【讨论】:

以上是关于如何使用c#从文本中删除html标签[重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何使 < 和 > 作为 HTML 中的实际文本符号而不是标签 [重复]

如何从呈现的文本中删除 HTML 标签

使用python,从字符串中删除HTML标签/格式[重复]

如何使用从 TextView 中的 firebaseDB 检索到的标签解析 HTML 文本?没有 WebView [重复]

如何从 html 中删除特定标签 [重复]

如何从字符串中删除所有html标签[重复]