如何获取html的文本内容[重复]

Posted

技术标签:

【中文标题】如何获取html的文本内容[重复]【英文标题】:how to get the text content of html [duplicate] 【发布时间】:2012-11-21 20:34:02 【问题描述】:

可能重复:How can I strip html tags from a string in ASP.NET?

asp.net中如何获取html的文本内容?

我在 asp.net 中编写了以下代码,但它给了我 html 而不是文本?

代码在这里:

Function GetData(ByVal dta As String)

        Dim comp As New Literal
        comp.Text = dta
            Return comp.Text
End Function

例如:

输入:<span><p> this is html </p></span>

输出应该是:这是html

【问题讨论】:

你要的是正在执行的asp页面的内容还是外部html页面的内容? 这个真的不清楚。你给这个方法什么输入,你期望什么输出,你得到什么? 不要认为comp 做了很多事情,你所做的只是复制字符串,然后返回结果,如此有效地返回dta。所以这基本上只是一个恒等函数。你想做什么,什么不起作用? 问题很明确,我需要来自 html 的文本内容,例如

hi all

我需要返回 hi all
好的,我已经编辑了问题 【参考方案1】:

试试这个

Function GetData(ByVal dta As String)

        Return Regex.Replace(dta, "<[^>]*(>|$)", String.Empty)
    End Function

【讨论】:

以上是关于如何获取html的文本内容[重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何获取HTML中用户输入到文本框中的内容?

从html标签jquery获取特定文本[重复]

如何通过html内容获取href和文本内容

如何使用 Nokogiri 获取没有任何文本内容的完整 HTML

如何使用 jquery 或 ajax 获取外部 html 页面内容 [重复]

如何使用 Selenium/Python 获取由 JavaScript 编写的 html 内容 [重复]