如何使用 selenium 记录 mathjax 加载时间

Posted

技术标签:

【中文标题】如何使用 selenium 记录 mathjax 加载时间【英文标题】:How can I use selenium to record mathjax loading time 【发布时间】:2019-10-30 20:23:49 【问题描述】:

我正在尝试使用 selenium 获取异步元素(MathJax 方程)加载时间。

我尝试编写一个python-selenium脚本来记录我的网站的加载时间,但是我的网站包含很多由Mathjax异步转换的方程,所以我无法正确记录。

我尝试先用“performance.timing”记录加载时间,但它只能提供我“加载时间”。

from selenium import webdriver
source = "url"
driver = webdriver.Chrome()
driver.get(source)
navigationStart = driver.execute_script("return window.performance.timing.navigationStart")
loadEventEnd = driver.execute_script("return window.performance.timing.loadEventEnd")
load_time = loadEventEnd - navigationStart

然后,我尝试找到“MathJax”的 ID 并等待直到加载一个 mathjax 元素(例如“MathJax-Element-1-Frame”)

from selenium import webdriver
import time
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
source = "url"
driver = webdriver.Chrome()
begin = time.time()
driver.get(source)
locator = (By.ID, 'MathJax-Element-1-Frame')
WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator))
end = time.time()
finish_time = end - begin

但时间不是绝对正确的。

【问题讨论】:

【参考方案1】:

尝试将datetime.utcnow()timedelta 一起使用,即:

将两个日期时间实例之间的差异表示为微秒分辨率的持续时间。

from datetime import datetime, timedelta
from selenium import webdriver
import time
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
source = "url"
driver = webdriver.Chrome()
begin = datetime.utcnow() + timedelta(1)
driver.get(source)
locator = (By.ID, 'MathJax-Element-1-Frame')
WebDriverWait(driver, 20, 0.5).until(EC.presence_of_element_located(locator))
end = datetime.utcnow() + timedelta(1)
finish_time = end - begin

更新

这是一个等待所有pendingRequests 加载的函数。 它也可能对您的情况有所帮助。

def wait_until_loaded(driver, seconds: int = 30) -> None:
    java_script_to_load = "var injector = window.angular.element('body').injector();"\
                                  " var $http = injector.get('$http');" \
                                  "return ($http.pendingRequests.length === 0);"
    end_time = datetime.utcnow() + timedelta(seconds=seconds)
    print("wait for All Elements....")
    while datetime.utcnow() <= end_time:
        try:
            if driver.execute_script(java_script_to_load):
                print(f"loaded in"
                      f" datetime.utcnow() + timedelta(seconds=seconds) - end_timeseconds")
                sleep(1)
                return
        except WebDriverException:
            continue
        sleep(0.1)
    raise TimeoutError("waiting for elements for too long")

希望对您有所帮助!

【讨论】:

非常感谢,但我的问题不是精度。我的问题是因为 MathJax 加载是异步的,并且记录时间不正确,因为我不知道 MathJax 何时完成加载。抱歉我的描述不好:( @OliverL 我添加了等待元素加载的功能试试吧!

以上是关于如何使用 selenium 记录 mathjax 加载时间的主要内容,如果未能解决你的问题,请参考以下文章

在 Selenium 中,如何关闭日志记录?

MathJax基本的使用方式

react + mathjax 公式渲染

如何在 jupyter/ipython 笔记本中启用 MathJax Upgreek?

MathJax的使用

MathJax 类型设置