从 div 标签中提取内容 C# RegEx
Posted
技术标签:
【中文标题】从 div 标签中提取内容 C# RegEx【英文标题】:Extract Content from Div Tag C# RegEx 【发布时间】:2011-06-14 02:24:19 【问题描述】:我需要在 divtestimonial1 div 中提取此内容 我正在使用以下正则表达式,但它只返回第一行
Regex r = new Regex("<div([^<]*<(?!/div>))");
%testimonial1headline
%testimonial1text
【问题讨论】:
【参考方案1】:Regular expressions are generally not a good choice for parsing html。使用HTML Agility Pack 之类的工具可能会更好,所以我建议你使用它。
话虽如此,您可以使用此正则表达式匹配您的特定样本输入:
<div.*?id="divtestimonial1".*?>.*</div>
但它可能会在您的实际场景中中断。 Regex 和 HTML 的问题之一是正确检测标签的嵌套等。
【讨论】:
虽然这通常是正确的,但 OP 在这里提出的要求是非常实用的,并且可以使用 RegEx。以上是关于从 div 标签中提取内容 C# RegEx的主要内容,如果未能解决你的问题,请参考以下文章