Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]

Posted

技术标签:

【中文标题】Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]【英文标题】:Java Program to read a html page and save its HTML code in a text file [closed] 【发布时间】:2012-10-22 00:01:13 【问题描述】:

我正在开发一个项目,因为我有一个模块,我需要在其中编写一个 Java 程序来读取 html 页面并将其 HTML 代码保存在文本文件中。 请任何人都可以提供上述程序.......

【问题讨论】:

除非您向我们展示一些我们不能(不应该)帮助您的代码。睡前阅读:What have you tried? 【参考方案1】:

看看http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html 你甚至不需要外部库。将此与 Bufferedwriter 结合使用:

import java.net.*;
import java.io.*;
import java.util.*;

public class URLReader 

    public static void main(String[] args) throws Exception 

        URL oracle = new URL("http://www.oracle.com/");
        BufferedReader in = new BufferedReader(
        new InputStreamReader(oracle.openStream()));
        BufferedWriter writer = new BufferedWriter(new FileWriter("outputfile.txt"));

        String inputLine;
        while ((inputLine = in.readLine()) != null)
            try
                writer.write(inputLine);
            
            catch(IOException e)
                e.printStackTrace();
                return;
            
        
        in.close();
        writer.close();
    

【讨论】:

【参考方案2】:

您可以使用 HTMLParser 完成此任务,Read about it here

【讨论】:

以上是关于Java程序读取html页面并将其HTML代码保存在文本文件中[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

如何保存链接 html 并将其转移到另一个页面以供以后使用?

下载 aspx 页面并将其另存为 HTML 页面 [关闭]

如何获取嵌入在 PhantomJS 运行的 JS 的 HTML 页面结果中的 JSON 对象并将它们传递给 java 代码?

从 android 读取 html5 网络数据库

如何使用事件侦听器向对象数组添加新元素并将其显示在 html 页面上

我如何从客户端(html)拍照并将其保存到服务器端(Python)