Java小程序--抓取emai

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java小程序--抓取emai相关的知识,希望对你有一定的参考价值。

一.实现思路

1、使用Java.net.URL对象,绑定网络上某一个网页的地址

2、通过java.net.URL对象的openConnection()方法获得一个HttpConnection对象

3、通过HttpConnection对象的getInputStream()方法获得该网络文件的输入流对象InputStream

4、循环读取流中的每一行数据,并由Pattern对象编译的正则表达式区配每一行字符,取得email地址

 

package cn.hyj;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
//和网络相关的操作
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


public class Test {

/**
* @param args
*/

public static void main(String[] args) throws IOException {
//1.1 创建一个url对象
URL url = new URL("https://www.douban.com/group/topic/8845032/"); 
//1.2 打开连接 
URLConnection conn = url.openConnection(); 
//1.3 设置连接网络超时时间 单位为毫秒
conn.setConnectTimeout(1000 * 10); 
//1.4 通过流 操作读取指定网络地址中的文件 
BufferedReader bufr = new BufferedReader(new InputStreamReader(conn.getInputStream())); 
String line = null; 
//1.5 匹配email的正则
String regex = "[a-zA-Z0-9_-][email protected]\\w+\\.[a-z]+(\\.[a-z]+)?";
//1.6 使用模式的compile()方法生成模式对象
Pattern p = Pattern.compile(regex); 
//1. 
while((line = bufr.readLine()) != null) { 
Matcher m = p.matcher(line); 
while(m.find()) { 
System.out.println(m.group());// 获得匹配的email 
} 
} 
}


}

 

以上是关于Java小程序--抓取emai的主要内容,如果未能解决你的问题,请参考以下文章

微信小程序代码片段分享

小程序各种功能代码片段整理---持续更新

Android获取各个应用程序的缓存文件代码小片段(使用AIDL)

Python的几个爬虫代码整理(网易云微信淘宝今日头条)

提效小技巧——记录那些不常用的代码片段

Java基础知识—发送Emai和访问MySQL数据库