使用正则表达式进行某网页中的email邮箱抽取

Posted 不怕天黑

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用正则表达式进行某网页中的email邮箱抽取相关的知识,希望对你有一定的参考价值。

 1 import java.io.BufferedReader;
 2 import java.io.FileNotFoundException;
 3 import java.io.FileReader;
 4 import java.io.IOException;
 5 import java.util.regex.Matcher;
 6 import java.util.regex.Pattern;
 7 
 8 
 9 public class EmailSpider {
10 
11     public static void main(String[] args) {
12         try {
13             BufferedReader br = new BufferedReader(new FileReader("D:\\share\\courseware\\1043633.html"));
14             String line = "";
15             while((line=br.readLine()) != null) {
16                 parse(line);
17             }
18         } catch (FileNotFoundException e) {
19             // TODO Auto-generated catch block
20             e.printStackTrace();
21         } catch (IOException e) {
22             // TODO Auto-generated catch block
23             e.printStackTrace();
24         }
25     }
26 
27     private static void parse(String line) {
28         Pattern p = Pattern.compile("[\\w[.-]][email protected][\\w[.-]]+\\.[\\w]+");
29         Matcher m = p.matcher(line);
30         while(m.find()) {
31             System.out.println(m.group());
32         }
33     }
34 
35 }

 

以上是关于使用正则表达式进行某网页中的email邮箱抽取的主要内容,如果未能解决你的问题,请参考以下文章

使用正则表达式验证邮箱格式

常用正则表达式—邮箱(Email)

Java正则抓取Email

Java正则抓取Email

js验证邮箱正则表达式,邮箱验证方法

正则表达式验证邮箱