检索 Html 标记 C# 的内部文本

Posted

技术标签:

【中文标题】检索 Html 标记 C# 的内部文本【英文标题】:Retrieving Inner Text of Html Tag C# 【发布时间】:2011-11-07 03:13:23 【问题描述】:

我有一个包含 html 的字符串。在这个字符串里面有一个 html 标签,我想检索它的内部文本。如何在 C# 中做到这一点?

这是我要检索其内部文本的 html 标记:

<td  class="container">

【问题讨论】:

可以使用波浪号`来标记代码块。 @Tejs 谢谢你,这很有用 手册全文:***.com/editing-help 我更喜欢这里的解决方案***.com/questions/785715/… 【参考方案1】:

使用Html Agility Pack。


编辑类似这样的东西(未测试)

HtmlDocument doc = new HtmlDocument();
string html = /* whatever */;
doc.LoadHtml(html);
foreach(HtmlNode td in doc.DocumentElement.SelectNodes("//td[@class='container']")

    string text = td.InnerText;
    // do whatever with text

你也可以直接用a different XPath selector选择文字。


相关问题:

How to use HTML Agility pack HTMLAgilityPack parse in the InnerHTML C#: HtmlAgilityPack extract inner text

【讨论】:

你能从包含 html 的字符串中加载一个 html 文档吗?还是我必须给它一条路径? 回答了我自己的问题:而不是使用 Load 使用 LoadHtml intead。再次感谢您!

以上是关于检索 Html 标记 C# 的内部文本的主要内容,如果未能解决你的问题,请参考以下文章

使用 C# 从 XML 中检索文本

c#连接Access数据库怎么把各项检索到的数据在各个文本框中显示?

c# sqlite - 从数据库中检索 BLOB 文本

如何使用 jQuery 遍历这个 DOM 并检索所需的文本?

在 C# 中确定声音何时完成播放

检索 HTML 标记的完整“签名”