selenium原理解析

Posted yaoqingzhuan

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了selenium原理解析相关的知识,希望对你有一定的参考价值。

相信很多测试小伙伴儿都听过或者使用过web自动化selenium,那您有没有研究过selenium的原理呢?为什么要使用webdriver.exe,webdriver.exe是干啥用的?selenium.common.exceptions.WebDriverException: Message: ‘xxxdriver‘ executable needs to be in PATH如何解决的 ?今天和大家一起分析selenium的整体运行原理是什么有一个直观的认识。

 

以python为例

此处省略环境搭建和安装过程了,不知道的小伙儿可以自行百度。

大家都只是在使用selenium时,先要导入webdriver,通过webriver进行实例化driver对象

from selenium import webdriver
chrome = webdriver.Chrome()

webdriver.Chrome()都做了什么?

通过跟踪Chrome类的__init__方法发现,在初始化时调用了Service类的start方法

# WebDriver初始化方法,executable_path为chromedriver
def __init__(self, executable_path="chromedriver", port=0,
                 options=None, service_args=None,
                 desired_capabilities=None, service_log_path=None,
                 chrome_options=None, keep_alive=True)
                 
# Service类的初始化和调用start方法
from .service import Service
self.service = Service(
            executable_path,
            port=port,
            service_args=service_args,
            log_path=service_log_path)
self.service.start()

继续跟踪Service类中start方法

cmd = [self.path]
cmd.extend(self.command_line_args())
self.process = subprocess.Popen(cmd, env=self.env,
                                     close_fds=platform.system() != Windows,
                                     stdout=self.log_file,
                                     stderr=self.log_file,
                                     stdin=PIPE)

cmd列表的第一个参数是传入的executable_path="chromedriver"

cmd列表的第二个参数是可用的端口

# class Service(object)中的方法,说明该方法需要子类重新
def command_line_args(self):
      raise NotImplemented("This method needs to be implemented in a sub class")

# 子类class Service(service.Service)
def command_line_args(self):
      return ["--port=%d" % self.port] + self.service_args

# self.port 属性在子类Service为声明,说明是在父类中声明的
# 在父类中的__init__方法中
self.port = port
if self.port == 0:
       self.port = utils.free_port()
# 此时说明port是调用utils.free_port获取的可用的端口,这就是为什么每次运行端口都可能不一样的原因所在

从上面分析可以得到cmd的参数为

cmd = [chromedriver, --port=52857]

端口是随机可用的

及start方法实际是使用subprocess中的Popen方法执行cmd中的命令chromedriver --port=52857

我们在dos窗口中执行该命令

技术图片

 

 貌似是起了一个服务,在浏览器输入 localhost:52857试试

技术图片

 

 可以访问,那管道该cmd窗口再进行访问呢?

无法访问了,可以看出subprocess.Popen(cmd)实际是启动了一个服务,那cmd命令中chromewebdrive是什么呢?

通过命令where chromewebdriver,发现 chromewebdriver就是我们添加到path路径的浏览器驱动

技术图片

 

 双击运行chromewebdriver.exe 发现,和subprocess.Popen(cmd)是惊人的相似,只是端口不同而已,通过浏览器也是可以进行访问的

技术图片

 

再执行完subprocess.Popen(cmd),紧接着执行了如下代码

# RemoteWebDriver类的初始化方法
RemoteWebDriver.__init__(
                self,
                command_executor=ChromeRemoteConnection(
                    remote_server_addr=self.service.service_url,
                    keep_alive=keep_alive),
                desired_capabilities=desired_capabilities)

通过对代码进行跟踪,RemoteWebDriver.__init__实际就是通过http的形式向webdriverserver获取一个session

技术图片

 

 综上webdriver.Chrome()其实就是启动了一个本地服务,并通过http获取一个新的session

接下来继续分析chrome.get(‘http://www.baidu.com‘)都做什么?

def get(self, url):
        """
        Loads a web page in the current browser session.
        """
        self.execute(Command.GET, {url: url})
        
# 都是调用的 self._request发起http请求
def execute(self, command, params):
    return self._request(command_info[0], url, body=data)

通过print或者debug,get方法本质也是向webdriver server 发起一次http请求,session/${session}/url

为了验证上说结论我们用接口的形式是否可以打开chrome浏览器

步骤:

1、本地双击webdriver.exe 启动一个一个webdriver 服务,端口9515

2、通过接口localhost:9515/session, 获取session

3、通过接口localhost:9515session/${session}/url,打开浏览器

接口1
localhost:9515/session method: POST params: {"desiredCapabilities": {"version": "", "platform": "ANY", "goog:chromeOptions": {"args": [], "extensions": []}, "browserName": "chrome"}, "capabilities": {"alwaysMatch": {"goog:chromeOptions": {"args": [], "extensions": []}, "platformName": "any", "browserName": "chrome"}, "firstMatch": [{}]}}

接口2
session/${session}/url 
method: POST
params: {
"url": "http://www.baidu.com", "sessionId": "${session}" }

在jmeter中运行上述接口,启动了Chrome浏览器比打开百度首页

技术图片

 

 

综上可以得出selenium的整个交互过程了,下面就是selenium的运行原理,写得不对欢迎拍砖

技术图片

 

思考:

selenium web UI自动化能否可以向接口自动化那些来编写web UI自动化呢?这样有什么好处和不足

以上是关于selenium原理解析的主要内容,如果未能解决你的问题,请参考以下文章

Selenium工作原理

selenium工作的大概原理

Selenium Xpath元素无法定位 NoSuchElementException: Message: no such element: Unable to locate element(代码片段

二级域名原理以及程序代码

python selenium片段+网络驱动程序

片段(Java) | 机试题+算法思路+考点+代码解析 2023