JAVA匹配html中所有img标签

Posted pxblog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了JAVA匹配html中所有img标签相关的知识,希望对你有一定的参考价值。

public static List<String> getImg(String htmlStr) {
        List<String> list = new ArrayList<String>();
        String img = "";
        Pattern p_image;
        Matcher m_image;
        // String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
        String regEx_img = "<img.*src\\\\s*=\\\\s*(.*?)[^>]*?>";
        p_image = Pattern.compile("^data:image/(png|gif|jpg|jpeg|bmp|tif|psd|ICO);base64,.*");
        //p_image = Pattern.compile(regEx_img, Pattern.CASE_INSENSITIVE);
        m_image = p_image.matcher(htmlStr);
        while (m_image.find()) {
            // 得到<img />数据
            img = m_image.group();
            System.out.println(img.toString());
        }
        return list;
    }

  

以上是关于JAVA匹配html中所有img标签的主要内容,如果未能解决你的问题,请参考以下文章

php简单正则匹配Img标签src内容采集?

java正则表达式匹配img标签并替换

匹配img标签 js正则表达式

php匹配<img/>,添加width,height

java 利用jsoup 如何去除一段代码中的所有html标签,只留纯文本

javascript 正则替换IMG标签