如何使用c#从文本中删除html标签[重复]
Posted
技术标签:
【中文标题】如何使用c#从文本中删除html标签[重复]【英文标题】:How to remove html tags from text using c# [duplicate] 【发布时间】:2014-11-26 07:18:12 【问题描述】:我有这样的字符串
<p>There was a <b>.NET</b> programmer and he stripped the <i>html</i> tags.</p><br> </br>
如何从给定的字符串中删除那些 html 标签
【问题讨论】:
使用 HTML 处理库,例如 HTML Agility Pack 见***.com/questions/19523913/… 【参考方案1】:使用Htmlagilitypack
var document = new HtmlDocument();
document.LoadHtml(data);
string text= document.DocumentNode.InnerText;
【讨论】:
感谢它的工作感谢 rjv......【参考方案2】:你可以使用 Regex.Replace 这样的事情就可以了
var input = "<p>There was a <b>.NET</b> programmer and he stripped the <i>HTML</i> tags.</p><br> </br>";
var filtered = System.Text.RegularExpressions.Regex.Replace(input, "<.*?>", "");
Console.WriteLine(filtered);
【讨论】:
以上是关于如何使用c#从文本中删除html标签[重复]的主要内容,如果未能解决你的问题,请参考以下文章
如何使 < 和 > 作为 HTML 中的实际文本符号而不是标签 [重复]
如何使用从 TextView 中的 firebaseDB 检索到的标签解析 HTML 文本?没有 WebView [重复]