Python Selenium 网络驱动程序。写我自己的预期条件

Posted

技术标签:

【中文标题】Python Selenium 网络驱动程序。写我自己的预期条件【英文标题】:Python Selenium WebDriver. Writing my own expected condition 【发布时间】:2013-10-23 00:48:57 【问题描述】:

我正在尝试编写自己的预期条件。我需要什么...我有一个 iframe。我也有一张图片。当图像的 scr 发生变化时,我想继续处理。我做了什么:

class url_changed_condition(object):
    '''
    Checks whether url in iframe has changed or not
    '''
    def __init__(self, urls):
        self._current_url, self._new_url = urls

    def __call__(self, ignored):
        return self._current_url != self._new_url  

后来在我的代码中:

def process_image(self, locator, current_url):
    try:
        WebDriverWait(self.driver, 10).until(ec.presence_of_element_located((By.TAG_NAME, u"iframe")))
        iframe = self.driver.find_element(*locator)
        if iframe:
            print "Iframe found!"
        self.driver.switch_to_frame(iframe)
        WebDriverWait(self.driver, 10).until(ec.presence_of_element_located((By.XPATH, u"//div")))

        # WebDriverWait(self.driver, 10).until(
            # url_changed_condition(
                # (current_url, self.driver.find_element(By.XPATH, u"//a/img").get_attribute(u"src"))))

        img_url = self.driver.find_element(By.XPATH, u"//a/img").get_attribute(u"src")
        print img_url
        self.search_dict[self._search_item].append(img_url)
        self.driver.switch_to_default_content()
    except NoSuchElementException as NSE:
        print "iframe not found! 0".format(NSE.msg)
    except:
        print "something went wrong"
        import traceback
        import sys
        type_, value_, trace_ = sys.exc_info()
        print type_, value_
        print traceback.format_tb(trace_)
    finally:
        return current_url  

此代码有效,但多次返回相同的 url。问题是,当我取消注释 url_changed_condition 时,它与TimeoutException 一起出现在(current_url, self.driver.find_element(By.XPATH, u"//a/img").get_attribute(u"src")) 它下面的行工作正常......我不明白。

【问题讨论】:

【参考方案1】:

此主题似乎缺少自定义预期条件的示例

其实很简单。首先,什么是Expected Condition in Python selenium bindings:

它是一种新型class(基于object) 它有__call__() magic method defined,它返回一个布尔值

有一大堆built-in expected condition classes。

让我们通过例子来工作。假设我们想要等到元素的文本以所需文本开头

from selenium.webdriver.support import expected_conditions as EC

class wait_for_text_to_start_with(object):
    def __init__(self, locator, text_):
        self.locator = locator
        self.text = text_

    def __call__(self, driver):
        try:
            element_text = EC._find_element(driver, self.locator).text
            return element_text.startswith(self.text)
        except StaleElementReferenceException:
            return False

用法:

WebDriverWait(driver, 10).until(wait_for_text_to_start_with((By.ID, 'myid'), "Hello, World!"))

【讨论】:

对于使用 Selenium 4 的人,将 EC._find_element ... 更改为: element_text = driver.find_element(*self.locator).text【参考方案2】:

使用@alecxe 描述的技术,但稍作修改以应对接受元素而不是定位器的预期条件: (在这种情况下,由于没有selenium.webdriver.support.expected_conditions.invisibility_of(element),我正在等待is_displayed()方法发出False信号)

class wait_for_element_to_be_invisible(object):
    def __init__(self, element):
        self.element = element

    def __call__(self, driver):
        return not(self.element.is_displayed())

def test_collapsible_blocks_expand_or_collapse(self):
    self.browser.get(self.server_url+'/courses/1/')
    shadables = self.browser.find_elements_by_class_name('shade')
    for shadable in shadables:
        ## parent, then sibling element (*)
        shady_bit = shadable.find_element_by_xpath('../following-sibling::*')
        element = WebDriverWait(self.browser, 10).until(
            EC.visibility_of(shady_bit))
        shadable.click()
        element = WebDriverWait(self.browser, 10).until(
            self.wait_for_element_to_be_invisible(shady_bit))

带有 DOM 相关位的 html 片段是:

<h4 class="shadable"><span class="shade" title="Show/Hide">↓</span>
  <a href="/link/to/uri">Title of Section</a>
</h4>
<article class="abstract">
  <p>Descriptive part which is shadable
  </p>
</article>`

【讨论】:

【参考方案3】:

根据documentation:

WebDriverWait 默认每 500 次调用 ExpectedCondition 毫秒,直到它成功返回。 成功的回报是 ExpectedCondition 类型为 Boolean 返回 true 或非 null 返回值 对于所有其他 ExpectedCondition 类型。

如果您注释掉自定义等待,您会多次获得相同的 URL,这一事实应该会给您一个提示。

__call__() 中,您总是返回False,因为网址永远不会改变。由于您要返回 False,因此永远不会满足 ExpectedCondition,您会得到 TimeoutException

所以要么重新定义 ExpectedCondition 逻辑,要么测试不同的情况。

【讨论】:

你告诉我的正是我所知道的。你的答案正是我在这里编码的。我需要每 500 毫秒调用一次self.driver.find_element(By.XPATH, u"//a/img").get_attribute(u"src"),以将它的返回值与我已经得到的值进行比较。当它们不相等时,我的__call__() 将返回True 我只是在解释你为什么得到TimeoutException,因为在你的问题中你似乎不明白为什么。就像我说的那样,您的问题是您要么检查错误的元素(因为 URL 显然永远不会改变),要么超时时间太短。尝试将其增加到 10 秒以上。另一种选择是检查 iframe 中的另一种情况。我不熟悉您正在测试的网站,因此无法进一步帮助您。 我来到这里是因为“ExpectedCondition 类型的成功返回是 Boolean 返回 true 或所有其他 ExpectedCondition 类型的返回值不是 null”写得很糟糕,完全没有意义......

以上是关于Python Selenium 网络驱动程序。写我自己的预期条件的主要内容,如果未能解决你的问题,请参考以下文章

如何处理Chrome Selenium网络驱动程序中的弹出窗口-Python

[Python3网络爬虫开发实战] 1.2.2-Selenium的安装

Python Selenium Webdriver`无法启动浏览器:权限被拒绝`

使用 Python/PhantomJS/Selenium 滚动无限页面

在 selenium python 中使用代理

Python+Selenium笔记:使用unittest