Python+Selenium学习-Xpath的使用

Posted 给自己一个向前进的理由

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python+Selenium学习-Xpath的使用相关的知识,希望对你有一定的参考价值。

  今天学习了几个关于自动化的概念。

  元素,网页元素(web element)。在页面上面的文本输入框、按钮、多选、单选、标签、和文字都叫元素,总之,凡是能在页面显示的对象都可以作文页面元素对象。

  元素定位,有时候也叫Locator,一个HTML页面元素,可以用很多方法描述这样元素的位置。网页元素有自己的位置,可以通过一些手段或者表达式去描述这个元素的页面对应位置。

  XPath,XPath即为XML路径语言,它是一种用来确定XML(标准通用标记语言的子集)文档中某部分位置的语言。XPath基于XML的树状结构,提供在数据结构树中寻找节点的能力,Xpath很快的被开发者采用来作为小型查询语言。

  Selenium一共有八种元素定位方法,其中,在实际开发自动化脚本过程中,XPath的使用是最多的一种方法。

一、Try Xpath的安装

  在Selenium中准确定位到要操作的网页元素是首要事情,之前在火狐中一直使用的是Firebug和Firepath,通过这两个插件验证Xpath和CSS Selector表达式。

  但是火狐在更新到57版本之后,对这些使用旧技术实现的插件都不在支持。所以我安装使用的是Try Xpath。这个插件也可以帮助我们验证Xpath以及CSS Selenium能不能定位到预期的网页元素,并且可以提供表达式具体定位到多少个元素的准确信息。

  安装步骤:

  1.打开火狐浏览器FireFox57以上的版本;

  2.在火狐菜单中选择【附加组件管理器】;

  3.在寻找更多扩展里面搜索【Try Xpath】;

  4.点击安装Try Xpath;

  5.点击后,用户会进入到Try Xpath这个插件页面,点击页面上的“添加到Firefox”按钮;

  6.在要求获取权限的提示中,点击“添加”;

  7.这样就可以看到Try Xpath添加成功的提示信息;

  8.在火狐右上角就可以看到一个TX的蓝色图标,说明安装成功了!!

二、Try Xpath的使用

  1.点击右上角的TX蓝色图标 

  

 

   2.在way这个下拉框下有很多选项,要验证Xpath的话,要选择“Xpath ANY_TYPE”

  

 

   3.如果Xpath表达式唯一定位到了预期元素,Try Xpath会用红色虚线框吧元素框起来,并且在Result部分的Count中会显示计数为1;

  4.当表达式定位到多个元素时,TryXpath会把所有元素都使用红色虚线框起来,并且在Result Count中显示准确的数量,这个时候可以使用Details下面的focus按钮来定位你要定位的元素,但是最好能够再优化下表达式,让表达式精确的唯一的定位到你要操作的网页元素,否则脚本在运行时会不稳定容易报错;

 

三、Xpath定位之text()方法

例:百度首页右上角“新闻”

  五、Xpath定位之contains()方法

  有时候,我们不喜欢写很长的XPath表达式,而且节点信息里面,有些信息是动态的,每次都获取都不一样,这个时候contains()方法就很好用。

例:JD首页左侧电脑菜单

 

 

六、Xpath定位之相对Xpath路径  

  有时目标元素的节点信息很少,不足够用来精确定位到目标元素,这个时候,我们就需要考虑,利用目标元素上下附件节点,通过确定附件的节点从而确定目标元素,这种方式叫相对路径。

A.直接定位标签

//input     #//标识定位到某一个标签,//*则代表所有标签,//input则定位所有input标签

 

B.标签+属性匹配

//input[@id=\'kw\']  或者//input[@type=\'text\']  #由一个标签+某一个属性的组合 ,其中@代表匹配属性名称,相当于匹配所有的input标签并匹配属性id=kw的元素

 

C.标签和多个属性

//input[@id=\'kw\' and @type=\'text\']    #由一个标签+多个属性的组合,相当于匹配了所有的input标签并匹配属性id=kw且属性type=text的元素

//input[@id=\'kw\' or @type=\'text\']      #由一个标签+多个属性的组合,相当于匹配了所有的input标签,并匹配属性id=kw或者属性type=text的元素 

 

D.父子定位

//form[@id="form"]/input   #相当于先定位到了父节点,再找到对应的子节点,常用语当前元素不易定位而父节点较易定位的情况

 

E.contains

//input[contains(@id,\'w\')]  #相当于匹配了所有的input标签且id属性包含字符串"w"的元素 (模糊定位)

//a[contains(text(),\'新闻\')]  #相当于匹配了所有的input标签且文本包含"新闻"  (模糊定位)

 

F.start-with和ends-with

//input[starts-with(@id,\'k\')]  #相当于匹配了所有的input标签且属性id以字母k开头的元素 (模糊定位)

//input[ends-with(@id,\'w\')]  #相当于匹配了所有的input标签且属性id以字母w结尾的元素 (模糊定位)

 

G.文本定位

//a[text()=\'新闻\']   #精准定位到本文属性,contains则是模糊定位

 

H.关系定位方式(通过子节点找父节点、爷节点;兄弟节点或者堂兄弟等等)

 

 

1.子节点找父节点

//input[@id="kw"]/..         #相当于我们精确定位到了查询输入框,然后找他的父节点,往回走一层(根据层级关系)

//input[@id="kw"]/parent::span

 

2.兄弟节点

//input[@id="kw"]/../span   #相当于找到了父节点再往下找子节点(兄弟节点)

//input[@id="kw"]/following-sibling::a   #往下找兄弟节点,也可以写//input[@id="kw"]/following-sibling::a[1],定位到后面的第几个a标签

//input[@id="kw"]/preceding-sibling::span  #往上找兄弟节点,也可以写//input[@id="kw"]/preceding-sibling::span[1],定位到前面的第几个span标签

 

同理可以找到相关的爷爷节点,堂兄弟节点等等

七、使用Try Xpath验证CSS Selector

  验证CSS Selector和验证Xpath的使用方式基本一样

  1.在Way中选择“querySelectorAll”选项;

  2.在Expression中输入的是要验证CSS Selector表达式,点击Execute按钮;

  Try Xpath 同样会把匹配到的元素使用红色虚线框出来。

 

参考文章:https://blog.csdn.net/yoyocat915/article/details/80167671

参考文章:https://www.cnblogs.com/xiaopeng4Python/p/10595086.html

参考文章:https://blog.csdn.net/u011541946/article/details/67639423

以上是关于Python+Selenium学习-Xpath的使用的主要内容,如果未能解决你的问题,请参考以下文章

python+selenium元素定位之XPath学习02

Python+Selenium基础篇之4-XPath的使用

selenium + Python -- xpath定位

Selenium2+python自动化9-CSS定位语法

Selenium2+python自动化9-CSS定位语法

python+selenium基础之XPATH定位