C#怎么用正则表达式提取链接和图片标签的属性

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了C#怎么用正则表达式提取链接和图片标签的属性相关的知识,希望对你有一定的参考价值。

<a href="http://网页地址">
<img src="http://图片地址" width="240" title="图片标题" />

怎么一次性提取上面 http://网页地址。http://图片地址 。图片标题?
因为页面里有许多条上面这样的代码

StringCollection resultList = new StringCollection();
try 
    Regex regexObj = new Regex(@"<a\\s*?href=""(.*?)"">\\s*?<img\\s*?src=""(.*?)"".*?title=""(.*?)"".*?/>");
    Match matchResult = regexObj.Match(subjectString);
    while (matchResult.Success) 
        resultList.Add(matchResult.Groups[1].Value);
        matchResult = matchResult.NextMatch();
     
 catch (ArgumentException ex) 
    // Syntax error in the regular expression

参考技术A 是否一定要用正则?
用js或者jquery获取a标记或者img的属性也可以的

提取a标签的链接文字

在seg上看到一个问题

<a href="http://www.abc.com/thread-4131866-1-1.html"  class="s xst" target="_blank">大家上</a>



问怎么用正则表达式提取大家上

我不会正则表达式,只会简单的js


<script>
    var a=document.getElementsByTagName(‘a‘);
    alert(a[0].innerHTML);
</script>


注意:getElementsByTagName 你看到中间的那个Elements了吗?是个复数形式,意思是返回多个对象,多个对象在js里面肯定是以数组保存的,而由于这个文档里面就有一个a元素,所以a[0]就是所取元素,那么它的innerHTML就是链接的文字了。

以上是关于C#怎么用正则表达式提取链接和图片标签的属性的主要内容,如果未能解决你的问题,请参考以下文章