java使用正则从爬虫爬的txt文档中提取QQ邮箱

Posted java虾米的博客

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java使用正则从爬虫爬的txt文档中提取QQ邮箱相关的知识,希望对你有一定的参考价值。

我的需求是从一堆文档中提取出qq邮箱,写了这篇帖子,希望能帮助和我有一样需求的人,谢谢!......

技术分享
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
 
public class GetEmail {
public static void getEmail() {
        File file = new File("E://itxm/email.txt");
        try{
            BufferedReader br = new BufferedReader(new FileReader(file));//构造一个BufferedReader类来读取文件
            String s = null;
            while((s = br.readLine())!=null){//使用readLine方法,一次读一行
              Pattern pattern = Pattern.compile("[^0-9]");
              Matcher matcher = pattern.matcher(s);
              String email = matcher.replaceAll("");
              if(!"".equals(email)&&email.length()>5){
               System.out.println(email+"@qq.com");
              }
            }
            br.close();
        }catch(Exception e){
            e.printStackTrace();
        }
}
 
public static void main(String[] args) {
    getEmail();
}
}

以上是关于java使用正则从爬虫爬的txt文档中提取QQ邮箱的主要内容,如果未能解决你的问题,请参考以下文章

基于Selenium库模拟用户行为的QQ空间爬虫

python爬虫怎么把用正则爬的数据写进文件里

用JAVA发送邮件,正文乱码该如何解决

网络爬虫时是怎么自动解析html

正则表达式。如何从xml文档中提取值[关闭]

java,不包含qq邮箱的正则表达式怎么写