Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]
Posted
技术标签:
【中文标题】Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]【英文标题】:Java Program to read a html page and save its HTML code in a text file [closed] 【发布时间】:2012-10-22 00:01:13 【问题描述】:我正在开发一个项目,因为我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。 请任何人都可以提供上述程序.......
【问题讨论】:
除非您向我们展示一些我们不能(不应该)帮助您的代码。睡前阅读:What have you tried? 【参考方案1】:看看http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html 你甚至不需要外部库。将此与 Bufferedwriter 结合使用:
import java.net.*;
import java.io.*;
import java.util.*;
public class URLReader
public static void main(String[] args) throws Exception
URL oracle = new URL("http://www.oracle.com/");
BufferedReader in = new BufferedReader(
new InputStreamReader(oracle.openStream()));
BufferedWriter writer = new BufferedWriter(new FileWriter("outputfile.txt"));
String inputLine;
while ((inputLine = in.readLine()) != null)
try
writer.write(inputLine);
catch(IOException e)
e.printStackTrace();
return;
in.close();
writer.close();
【讨论】:
【参考方案2】:您可以使用 HTMLParser 完成此任务,Read about it here
【讨论】:
以上是关于Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]的主要内容,如果未能解决你的问题,请参考以下文章
如何保存链接 html 并将其转移到另一个页面以供以后使用?
如何获取嵌入在 PhantomJS 运行的 JS 的 HTML 页面结果中的 JSON 对象并将它们传递给 java 代码?