UI自动化之特殊处理四(获取元素属性爬取页面源码常用断言)
Posted weizhideweilai
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了UI自动化之特殊处理四(获取元素属性爬取页面源码常用断言)相关的知识,希望对你有一定的参考价值。
获取元素属性爬取页面源码常用断言,最终目的都是为了验证我们实际结果是否等于预期结果
目录
1、获取元素属性
2、爬取页面源码
3、常用断言
1、获取元素属性
2、爬取页面源码
# coding:utf-8 from selenium import webdriver import re
driver = webdriver.Firefox()
driver.get("http://xx.com/") page = driver.page_source
url_list = re.findall(‘href="(.*?)"‘, page, re.S) url_all = [] for url in url_list: if "http" in url: url_all.append(url)
用html.parser解析html
# coding:utf-8 from bs4 import BeautifulSoup import requests r = requests.get("http://www.cnblogs.com/yoyoketang/") blog = r.content soup = BeautifulSoup(blog, "html.parser") times = soup.find_all(class_="xx") for i in times: print i.a.string # 获取a标签的文本 title = soup.find_all(class_="postTitle") for i in title: print i.a.string
3、常用断言
以上是关于UI自动化之特殊处理四(获取元素属性爬取页面源码常用断言)的主要内容,如果未能解决你的问题,请参考以下文章
基于python实现UI自动化5. selenium实现获取页面元素属性(内容标题URL浏览器名称等)
基于python实现UI自动化5. selenium实现获取页面元素属性(内容标题URL浏览器名称等)