java获取html页面代码里面的图片的地址的集合

Posted ghlin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java获取html页面代码里面的图片的地址的集合相关的知识,希望对你有一定的参考价值。

package com.blue.common.util;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.List;
import java.util.Set;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class GetImagePathUtil {

/**
* 得到网页中图片的地址
*/
public static Set<String> getImgStr(String htmlStr) {
Set<String> pics = new HashSet<String>();
String img = "";
Pattern p_image;
Matcher m_image;
// String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
String regEx_img = "<img.*src\\s*=\\s*(.*?)[^>]*?>";
p_image = Pattern.compile
(regEx_img, Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while (m_image.find()) {
// 得到<img />数据
img = m_image.group();
// 匹配<img>中的src数据
Matcher m = Pattern.compile("src\\s*=\\s*\"?(.*?)(\"|>|\\s+)").matcher(img);
while (m.find()) {
pics.add(m.group(1));
}
}
return pics;
}

}



































以上是关于java获取html页面代码里面的图片的地址的集合的主要内容,如果未能解决你的问题,请参考以下文章

使用selenium的方式获取网页中图片的链接和网页的链接,来判断是否是死链

js 获取图片并下载到本地

js获取url参数 如何改变当前页面内某个图片的地址?

如何把jquery的值放入img标签的src里面

document.getElementsByTagName获取js写的一个页面里面的标签

PHP代码里有没有办法实现让页面跳转,但地址栏上的URL不变