Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法
Posted 挣扎的蓝藻
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法相关的知识,希望对你有一定的参考价值。
实例为从我文章中读取标题。
通过 class 属性锁定标题元素,把匹配的内容打印出来。
下面是源码:
package com.test.test;
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
public class WebhtmlTest {
public static void main(String[] args) throws IOException {
/*
作用:从url中读取web页面的内容
*/
String html_url = "https://lanzao.blog.csdn.net/article/details/119329989";
// 连接的超时时间
System.setProperty("sun.net.client.defaultConnectTimeout", "20000");
// 读取数据的超时时间
System.setProperty("sun.net.client.defaultReadTimeout", "20000");
try {
URL url = new URL(html_url);
URLConnection url_connection = url.openConnection();
InputStream input_stream = url_connection.getInputStream();
InputStreamReader input_stream_reader = new InputStreamReader(input_stream,"utf-8");
BufferedReader html_reader = new BufferedReader(input_stream_reader);
String html_reader_line = null;
// 读取html内容
while ((html_reader_line = html_reader.readLine()) != null) {
if(html_reader_line.contains("class=\\"title-article\\"")) {
System.out.println(html_reader_line);
}
}
// 关闭创建的对象
html_reader.close();
input_stream_reader.close();
input_stream.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
喜欢的点个赞❤吧!
以上是关于Java 技术篇 - 从指定的web网页页面中读取html内容实例演示,从http协议下的url地址中读取web页面内容方法的主要内容,如果未能解决你的问题,请参考以下文章
Java全栈web网页技术:16.书城项目实战五:图书的分页显示
Java全栈web网页技术:16.书城项目实战五:图书的分页显示