java通过URL获取文本内容

Posted 菜鸟_Admin

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java通过URL获取文本内容相关的知识,希望对你有一定的参考价值。

public static String readFileByUrl(String urlStr) {
        String res=null;
        try {
            URL url = new URL(urlStr);  
            HttpURLConnection conn = (HttpURLConnection)url.openConnection();  
            //设置超时间为3秒
            conn.setConnectTimeout(3*1000);
            //防止屏蔽程序抓取而返回403错误
            conn.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
            //得到输入流
            InputStream inputStream = conn.getInputStream();  
            res = readInputStream(inputStream);
        } catch (Exception e) {
            logger.error("通过url地址获取文本内容失败 Exception:" + e);
        }
        return res;
    }
/**
     * 从输入流中获取字符串
     * @param inputStream
     * @return
     * @throws IOException
     */
    public static String readInputStream(InputStream inputStream) throws IOException {  
        byte[] buffer = new byte[1024];  
        int len = 0;  
        ByteArrayOutputStream bos = new ByteArrayOutputStream();  
        while((len = inputStream.read(buffer)) != -1) {  
            bos.write(buffer, 0, len);  
        }  
        bos.close();  
        System.out.println(new String(bos.toByteArray(),"utf-8"));
        return new String(bos.toByteArray(),"utf-8");
    }  

 

以上是关于java通过URL获取文本内容的主要内容,如果未能解决你的问题,请参考以下文章

如何通过html内容获取href和文本内容

如何从此 URL 从文件中获取内容?

通过 id 从片段获取编辑文本到其托管活动

JS获取URL的参数

如何通过Java代码实现对网页数据进行指定抓取

java获取随机时间的源码片段