java 代码从网站提取数据

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了java 代码从网站提取数据相关的知识,希望对你有一定的参考价值。

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;


public class Scraping {

    public static void main(String[] args) throws IOException {

        URL url = new URL("http://www.ase.com.jo/ar/bulletins/daily");

        URLConnection con = url.openConnection();
        InputStream is =con.getInputStream();
        BufferedReader br = new BufferedReader(new InputStreamReader(is));

        String line = null;

        while ((line = br.readLine()) != null) {
            System.out.println(line);
        }
    }
}
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Extracting {
   public static void main(String[] args) {
      String html = "http://www.ase.com.jo/ar/bulletins/daily";
      try {
         Document doc = Jsoup.connect(html).get();
         Elements tableElements = doc.select("table");

         Elements tableHeaderEles = tableElements.select("thead tr th");
         System.out.println("headers");
         for (int i = 0; i < tableHeaderEles.size(); i++) {
            System.out.println(tableHeaderEles.get(i).text());
         }
         System.out.println();

         Elements tableRowElements = tableElements.select(":not(thead) tr");

         for (int i = 0; i < tableRowElements.size(); i++) {
            Element row = tableRowElements.get(i);
            System.out.println("row");
            Elements rowItems = row.select("td");
            for (int j = 0; j < rowItems.size(); j++) {
               System.out.print("	"+rowItems.get(j).text());
            }
            System.out.println();
         }

      } catch (IOException e) {
         e.printStackTrace();
      }
   }
}

以上是关于java 代码从网站提取数据的主要内容,如果未能解决你的问题,请参考以下文章

Java提取网站后台数据进行处理并排名

从网站表中提取数据

使用 Java 从 Web 中提取数据 [关闭]

使用 Java 从网页中提取数据?

java爬取网站中所有网页的源代码和链接

仅从网站中提取所需的列