python 利用爬虫获取页面上下拉框里的所有国家

Posted nancy05

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 利用爬虫获取页面上下拉框里的所有国家相关的知识,希望对你有一定的参考价值。

前段时间,领导说列一下某页面上的所有国家信息,话说这个国家下拉框里的国家有两三百个,是第三方模块导入的,手动从页面拷贝,不切实际,于是想着用爬虫去获取这个国家信息,并保存到文件里。

下面是具体的代码,写的也是比较简单,利用Selenium操作页面,获取下拉国家列表的信息,并保存到文件里

from selenium import webdriver
import xlwt
driver = webdriver.Chrome(C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe)
driver.get(https://xxx.xx.com/contact)
countries = driver.find_element_by_id(country)#获取country dropdownlist
options_list = countries.find_elements_by_tag_name(option)
options = []
for option in options_list: #获取country dropdownlist里所有的数据
    options.append(option.text)
with open(country_list.txt,w+, encoding=utf-8) as f:
    for i in options:
        if i != Select your country:
            f.write(i+\n)
driver.quit()

 

以上是关于python 利用爬虫获取页面上下拉框里的所有国家的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫如何获取页面内所有URL链接?本文详解

Excel 如何将筛选功能下拉框里的数据导出来

robot framework + selenium 如何处理此类的下拉框 如何选中下拉框里的值

左右两个下拉框里的内容互换

python如何获取cmd命令框里的内容

想用JS做一个下拉框,下拉框里的值根据当前年份自动往前和往后添加5年,如当前是2010年,值就为2005~2015