查找网页元素并且输出到固定文件

Posted 琦仔

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了查找网页元素并且输出到固定文件相关的知识,希望对你有一定的参考价值。

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.PrintWriter;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class HrefTest {
    
   /**
    * 输出文件方法
    * @param filePath
    * @param sb
    * @throws IOException
    */
    public static void outHref(String filePath,StringBuffer sb) throws IOException{
        
        try {
            File file = new File(filePath);
            PrintWriter writer = new PrintWriter(new FileOutputStream(file));  
             writer.write(sb.toString());
             writer.close();
             
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
    }
    /**
     * 定位元素
     * @param args
     */

    public static void main(String[] args) {
        String  filePath="/Users/liuqi/Desktop/result.log";
        final String url="http://www.baidu.com/";
        String str="";
        StringBuffer sb=new StringBuffer();
        try {
            Document doc=Jsoup.connect(url).get();
            Elements links=doc.getElementsByTag("a");
            for(Element link:links){
                if(link.attr("href").contains("baidu"))
                     str=link.attr("href").toString();
                     sb.append(str+"\n");
                     System.out.println(link.attr("href"));
                     outHref(filePath, sb);
            }
            
        } catch (IOException e) {
            e.printStackTrace();
        }
        

    }
    

}

需要加载jsoup-1.10.1.jar这个jar

以上是关于查找网页元素并且输出到固定文件的主要内容,如果未能解决你的问题,请参考以下文章

CSS position:fixed 实现html元素固定于某位置

网页抓取和查找元素

如何使网页的背景图片不随着滚动条移动 使背景图片固定?(要代码)

针对源代码和检查元素不一致的网页爬虫——利用SeleniumPhantomJSbs4爬取12306的列车途径站信息

怎么用vb来截取网页元素

网页上审查元素提取一段完整网页代码