傀儡师 |等待所有 JavaScript 执行完毕

Posted

技术标签:

【中文标题】傀儡师 |等待所有 JavaScript 执行完毕【英文标题】:Puppeteer | Wait for all JavaScript is executed 【发布时间】:2019-04-28 05:50:56 【问题描述】:

我尝试从多个页面截取屏幕截图,这些页面应该完全加载(包括延迟加载的图像)以供以后比较。

我发现lazyimages_without_scroll_events.js example 很有帮助。

使用以下代码,屏幕截图看起来不错,但存在一些主要问题。

async function takeScreenshot(browser, viewport, route) 
  return browser.newPage().then(async (page) => 
    const fileName = `$viewport.directory/$getFilename(route)`;

    await page.setViewport(
      width: viewport.width,
      height: 500,
    );
    await page.goto(
        `$config.server.master$route.html`,
        
          waitUntil: 'networkidle0',
        
    );
    await page.evaluate(() => 
      /* global document,requestAnimationFrame */
      let lastScrollTop = document.scrollingElement.scrollTop;

      // Scroll to bottom of page until we can't scroll anymore.
      const scroll = () => 
        document.scrollingElement.scrollTop += 100;
        if (document.scrollingElement.scrollTop !== lastScrollTop) 
          lastScrollTop = document.scrollingElement.scrollTop;
          requestAnimationFrame(scroll);
        
      ;
      scroll();
    );
    await page.waitFor(5000);
    await page.screenshot(
      path: `screenshots/master/$fileName.png`,
      fullPage: true,
    );

    await page.close();
    console.log(`Viewport "$viewport.name", Route "$route"`);
  );

问题:即使page.waitFor() 的值更高(超时),有时页面上与前端相关的所有 javascript 都没有完全执行。

对于一些旧页面,一些 JavaScript 可能会更改前端。 F.e.在一个遗留案例中是jQuery.matchHeight

最佳情况:在理想情况下,Puppeteer 会等到所有 JavaScript 都被评估和执行。 这样的事情可能吗?


编辑cody-g 的帮助下,我可以稍微改进一下脚本。

function jQueryMatchHeightIsProcessed() 
  return Array.from($('.match-height')).every((element) => 
    return element.style.height !== '';
  );


// Within takeScreenshot() after page.waitFor()
await page.waitForFunction(jQueryMatchHeightIsProcessed, timeout: 0);

...但它远非完美。看来我必须为不同的前端脚本找到类似的解决方案才能真正考虑目标页面上发生的一切。

在我的例子中,jQuery.matchHeight 的主要问题是它在不同的运行中处理不同的高度。可能是由于图像延迟加载引起的。看来我必须等到可以用 Flexbox 替换它。 (^_^)°

其他需要解决的问题:

禁用动画:

await page.addStyleTag(
  content: `
    * 
      transition: none !important;
      animation: none !important;
    
  `,
);

处理幻灯片:

function handleSwiperSlideshows() 
  Array.from($('.swiper-container')).forEach((element) => 
    if (typeof element.swiper !== 'undefined') 
      if (element.swiper.autoplaying) 
        element.swiper.stopAutoplay();
        element.swiper.slideTo(0);
      
    
  );


// Within takeScreenshot() after page.waitFor()
await page.evaluate(handleSwiperSlideshows);

但还是不够。我认为对这些遗留页面进行可视化测试是不可能的。

【问题讨论】:

你有没有找到一个通用的方法来完成这个? 遗憾的是没有。我所做的一切都在我的 EDIT 中提及。 【参考方案1】:

以下waitForFunction 可能对您有用,您可以使用它来等待任意函数评估为真。如果您可以访问页面的代码,您可以设置窗口状态并使用它来通知 puppeteer 可以安全地继续,或者只是依赖某种其他就绪状态。 注意:此函数为轮询函数,每隔一段可指定的时间间隔重新计算。

const watchDog = page.waitForFunction('<your function to evaluate to true>');

例如,

const watchDog = page.waitForFunction('window.status === "ready"');
await watchDog;

在您的页面代码中,您只需将window.status 设置为ready

要在多个异步文件中使用多个看门狗,您可以这样做

index.js

...import/require file1.js;
...import/require file2.js;
...code...

file1.js:

var file1Flag=false; // global
...code...
file1Flag=true;

file2.js:

var file2Flag=false; // global
...code...
file2Flag=true;

main.js:

const watchDog = page.waitForFunction('file1Flag && file2Flag');
await watchDog;

【讨论】:

是的,可以将代码添加到目标页面。这个解决方案的难点在于为这种功能找到合适的位置。有几个使用RequireJS 异步加载和执行的脚本。没有单一的终点。 对。不过,在这种情况下,您可以创建多个看门狗,对吗?我不知道在这种情况下您可以使用任何“空闲”标志。 能否为目标页面添加一个简单的示例代码,可以与看门狗一起使用? 嗯,不确定要添加什么,但我添加了一些东西。【参考方案2】:
async function takeScreenshot(browser, viewport, route) 
  return browser.newPage().then(async (page) => 
    const fileName = `$viewport.directory/$getFilename(route)`;

    await page.setViewport(
      width: viewport.width,
      height: 500,
    );
    await page.goto(
        `$config.server.master$route.html`,
        
          waitUntil: 'networkidle0',
        
    );
    await page.evaluate(() => 
      scroll(0, 99999)
    );
    await page.waitFor(5000);
    await page.screenshot(
      path: `screenshots/master/$fileName.png`,
      fullPage: true,
    );

    await page.close();
    console.log(`Viewport "$viewport.name", Route "$route"`);
  );

【讨论】:

请您补充一些解释好吗?到目前为止,我可以看到您更改了滚动行为。我不确定这对我的情况有何帮助。

以上是关于傀儡师 |等待所有 JavaScript 执行完毕的主要内容,如果未能解决你的问题,请参考以下文章

电子傀儡师出错。 “require 未定义”和“__dirname 未定义”

java主线程等待所有子线程执行完毕在执行(常见面试题)

go 等待所有 goroutine 执行结束的方法

线程池: 等待线程池内所有线程执行完毕后再继续任务

C# 如何让线程等待到执行完毕才执行下一个循环

C#多线程: 怎么知道 多个线程 执行完毕了?所有的线程执行完毕后 我要做处理