如何使用c#从文本中删除html标签[重复]

Posted

技术标签:

【中文标题】如何使用c#从文本中删除html标签[重复]【英文标题】:How to remove html tags from text using c# [duplicate] 【发布时间】:2014-11-26 07:18:12 【问题描述】:

我有这样的字符串

<p>There was a <b>.NET</b> programmer and he stripped the <i>html</i> tags.</p><br> </br>

如何从给定的字符串中删除那些 html 标签

【问题讨论】:

使用 HTML 处理库,例如 HTML Agility Pack 见***.com/questions/19523913/… 【参考方案1】:

使用Htmlagilitypack

var document = new HtmlDocument();
document.LoadHtml(data);
string text= document.DocumentNode.InnerText;

【讨论】:

感谢它的工作感谢 rjv......【参考方案2】:

你可以使用 Regex.Replace 这样的事情就可以了

var input = "<p>There was a <b>.NET</b> programmer and he stripped the <i>HTML</i> tags.</p><br> </br>";
var filtered = System.Text.RegularExpressions.Regex.Replace(input, "<.*?>", "");
Console.WriteLine(filtered);

【讨论】:

以上是关于如何使用c#从文本中删除html标签[重复]的主要内容,如果未能解决你的问题,请参考以下文章