Android正则表达式获取网页源链接

Posted

技术标签:

【中文标题】Android正则表达式获取网页源链接【英文标题】:Android regular expression to get links of webpage source 【发布时间】:2012-05-28 06:35:52 【问题描述】:

我正在寻找一个正则表达式来匹配来自网页源的链接。 如果您有任何代码示例,将不胜感激。

谢谢

【问题讨论】:

你在这里搜索过吗?我自己已经看到至少十几个相同的请求。 我已经搜索过,但我找不到 android 【参考方案1】:

要匹配href 属性值,可以使用以下方法:

final Pattern pattern = Pattern.compile("href=\"(.*+)\"");
Matcher matcher = pattern.matcher(html);
String link = null;
while (matcher.find())

    link = matcher.group(1);
    Log.i("my.regex", "Found link: " + link);

【讨论】:

@Neeraj,我不确定你的意思...... mailto 是一个特殊的锚属性。你打算如何在这里使用它?

以上是关于Android正则表达式获取网页源链接的主要内容,如果未能解决你的问题,请参考以下文章

常用正则表达式爬取网页信息及HTML分析总结

C#怎么用正则表达式提取链接和图片标签的属性

用于解析网页链接的正则表达式?

正则表达式从字符串中查找电子邮件地址

网页爬虫获取课程信息

网页爬虫获取课程信息