取HTML的中文字

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了取HTML的中文字相关的知识,希望对你有一定的参考价值。

/// <summary>

///html中提取纯文本

/// </summary>

/// <param name="strHtml"></param>

/// <returns></returns>

public static string GetHtmlContentText(string strHtml)

{

if (string.IsNullOrEmpty(strHtml))

return "";

Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase);

string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容

strOutput = strOutput.Replace("<", "");

strOutput = strOutput.Replace(">", "");

strOutput = strOutput.Replace("&nbsp;", "");

return strOutput;

}

以上是关于取HTML的中文字的主要内容,如果未能解决你的问题,请参考以下文章

java 取字符串的中字母数字组合?

HTML代码片段

HTML代码片段

python爬取百度贴吧文字内容

Python如何简单爬取腾讯新闻网前五页文字内容?

Android Place自动填充片段:无法设置文字