尝试使用 puppeteer 插件,但我不断收到 Unhandled Promise Rejection 的错误:ReferenceError: Can't find variable: requir

Posted

技术标签:

【中文标题】尝试使用 puppeteer 插件,但我不断收到 Unhandled Promise Rejection 的错误:ReferenceError: Can\'t find variable: require【英文标题】:Trying to use puppeteer plugin but I keep getting an error for Unhandled Promise Rejection: ReferenceError: Can't find variable: require尝试使用 puppeteer 插件,但我不断收到 Unhandled Promise Rejection 的错误:ReferenceError: Can't find variable: require 【发布时间】:2020-11-30 12:22:28 【问题描述】:

我的程序应该在名为 suplexed.com 的网站上搜索给定的运动鞋代码,并返回给定运动鞋可用的最小尺寸的价格。当我使用节点在控制台中运行单个 .js 文件时,我确实得到了我正在寻找的值。但是,当我运行应该使用 .js 文件的 html 文件时,出现以下错误

Unhandled Promise Rejection: ReferenceError: Can't find variable: require

这是我的 javascript 代码,名为“scrapers.js”。我添加了 cmets 以便更好地理解。使用节点在控制台中运行 .js 文件时没有问题。但是当通过 HTML 使用 live-server 运行目录时,它不起作用。这里的问题在于前几行代码,因为它不会越过那里

async function scrapeStockx(url)
  const site = "stockx.com";
  let puppeteer = require('puppeteer-extra');
  let pluginStealth = require('puppeteer-extra-plugin-stealth');
  puppeteer.use(pluginStealth());

  puppeteer = require('puppeteer');
  
  const browser = await puppeteer.launch(headless: false)
  const page = await browser.newPage();
  await page.goto(url,waitUntil: 'networkidle0');


  // get the value for the row sneaker size for stockx
  await page.waitForXPath('//*[@id="pricer_table"]/tbody/tr[4]/td[1]');
  const [sneakerSize]= await page.$x('//*[@id="pricer_table"]/tbody/tr[4]/td[1]');
  
  const sneakerSizeTxt = await sneakerSize.getProperty('textContent');
  const sneakerSizeRawTxt = await sneakerSizeTxt.jsonValue(); 


  // get the value for the row sneaker size price for stockx
  await page.waitForXPath('//*[@id="pricer_table"]/tbody/tr[4]/td[2]/span[1]');
  const [sneakerPrice]= await page.$x('//*[@id="pricer_table"]/tbody/tr[4]/td[2]/span[1]');
   
  const sneakerPriceTxt = await sneakerPrice.getProperty('textContent');
  const sneakerPriceRawTxt = await sneakerPriceTxt.jsonValue(); 
  
  // print the sneaker size and price to verify TO CONSOLE
  console.log(printSizeAndPrices(sneakerSizeRawTxt, sneakerPriceRawTxt, site)); 

  // print the sneaker size and price TO WEBSITE
  let sneakerPrint = document.createElement("p");
  sneakerPrint.textContent = printSizeAndPrice(sneakerPriceRawTxt, sneakerPriceRawTxt, site)
  document.querySelector("body").appendChild(sneakerPrint);

  browser.close();


document.querySelector("#search-form").addEventListener("submit", function(e)
  e.preventDefault()

  // get sneaker code using the textbox created in html
  // const sneakerCode = e.target.elements.enterBox.value
  
  // manually enter a unique sneaker code
  const sneakerCode = "XXXXXX-XXX";

  // print sneaker code to console to verify
  console.log("sneakerCode: " + sneakerCode)
 
  // create the website address of the sneaker
  const address = ('https://suplexed.com/web/' + sneakerCode)

  // print website address to verify
  console.log("address: " + address)

  // call the function to retrieve the wanted values for the chosen sneaker
  scrapeStockx(address)
)

function printSizeAndPrice(sneakerSizeRawTxt, sneakerPriceRawTxt, site)
  return `$sneakerSizeRawTxt is $sneakerPriceRawTxt on $site`;

这是我的html代码

<!DOCTYPE html>
<html>
    <head>
    
    </head>
    <body>
        <p>Enter a sneaker code and hit the button to search</p>

        <form id = "search-form">
            <input type = "text" placeholder = "XXXXXX-XXX" name = "enterBox">
            <button>Search</button>
        </form>

        <script src = "scrapers.js"></script>
    </body>
</html>

【问题讨论】:

puppeteer 不会在浏览器中运行,它是一个节点库。 @pguardiario 那么你有什么替代网络抓取的方法吗? 您想将代码提交到后端(快递?)并在那里抓取。 【参考方案1】:

这不是问题的完整解决方案,但它确实让我发现了一个我现在正在研究的新错误。在我的 index.html 文件中,我只是在包含 require.js 文件的主 js 标记之前添加了一个脚本标记

<script src = "require.js"></script>

【讨论】:

以上是关于尝试使用 puppeteer 插件,但我不断收到 Unhandled Promise Rejection 的错误:ReferenceError: Can't find variable: requir的主要内容,如果未能解决你的问题,请参考以下文章

尝试使用 pip 安装 opencv 但我不断收到错误

我正在尝试使用 PHP 连接到 Azure 服务总线队列,但我不断收到此错误

我正在尝试使用 UI 来写入和读取单独的类,但我不断收到属性错误 [重复]

我正在尝试使用 Jmeter 在 Intranet 上记录应用程序,但我不断收到 DNS 失败消息

我正在尝试归档一个由流星构建的 ios 应用程序,但 Xcode 但我不断收到“模糊使用 [...]”

我究竟做错了啥?我正在尝试将 selenium 依赖项添加到 Intellij,但我不断收到错误