selenium+java-查找页面中包含关键字的URL

Posted 雪山非猪

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium+java-查找页面中包含关键字的URL相关的知识,希望对你有一定的参考价值。

package seleniumLearn1;

import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.List;

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.WebElement;
import org.openqa.selenium.chrome.ChromeDriver;

import com.gargoylesoftware.htmlunit.javascript.host.Element;

/**
 * 获取http://www.qyer.com页面中,所有</a>标签"href"属性值
 * 包含英文单词“place”的URL,并将结果保存到“/home/result.log”文件中。
 * @author 0
 *
 */
public class Search {
	
	static String baseUrl="http://www.qyer.com";
	public static void main(String[] args) {
		System.setProperty("webdriver.chrome.driver", "E:\\\\webDriver\\\\chromedriverV2.28.exe");
		File logFile = new File("d://logFile.txt");
		if(!(logFile.exists())) {
			try {
				logFile.createNewFile();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
		}
		
		WebDriver driver = new ChromeDriver();
		driver.get(baseUrl);
		
		//获取所有a标签
		List<WebElement> aList = driver.findElements(By.tagName("a"));
		try {
			Thread.sleep(10000);
		} catch (Exception e) {
			e.printStackTrace();
		}
		//便利所有标签
		FileOutputStream fs = null;
		try {
			fs = new FileOutputStream(logFile);
			for (WebElement a : aList) {
				System.out.println(a.getAttribute("href"));//获取a标签中的URL
				
				//获取a标签href属性值
				String urlStr = a.getAttribute("href");
				if(urlStr.contains("place")) {
					urlStr +="\r\n";
					//将URL写入文件中
					fs.write(urlStr.getBytes());
				}
				
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
}

  

以上是关于selenium+java-查找页面中包含关键字的URL的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫编程思想(95):使用Selenium查找单个节点

slenium 定位text contain

在 Selenium python 中包含某些文本的其他 div 中选择某些 div 的方法

selenium玩转svg操作

求高手帮助,如何将EXCEL中包含某一关键词的所有行都提取出来,单独显示?

使用Ews API去删除邮件内容中包含特定关键字的邮件