javascript 木偶蜘蛛.js

Posted 2021-05-03

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了javascript 木偶蜘蛛.js相关的知识，希望对你有一定的参考价值。

async function link(keys) {
  const browser = await puppeteer.launch({
    ignoreHTTPSErrors: true,
    headless: false,
    devtools: false
  })
  const page = await browser.newPage()
  let results = {}
  console.log('keys', keys)
  for (let key of keys) {
    await page.goto(`https://btso.pw/search/${key}`)
    // await page.waitFor(5000)
    const result = await page.evaluate(() => {
      var data = []
      var t = document.querySelector('.data-list')
      if (t) {
        var a = t.getElementsByTagName('a')
        for (var i = 0; i < a.length; i++) {
          if (!a[i].className.match('btn')) {
            data.push({
              title: a[i].title,
              maglink:
                'magnet:?xt=urn:btih:' +
                a[i].outerHTML
                  .replace(/.*hash\//, '')
                  .replace(/" .*\n.*\n.*\n.*/, ''),
              size: a[i].nextElementSibling.textContent,
              src: a[i].href
            })
          }
        }
      }
      return data
    })
    results[key] = result
  }
  browser.close()
  return results
}

以上是关于javascript 木偶蜘蛛.js的主要内容，如果未能解决你的问题，请参考以下文章

javascript 伪装 - 无法察觉的木偶戏

javascript 木偶碎片

js如何判断访问来源是来自搜索引擎(蜘蛛人)还是直接访问

带有木偶或卓别林的 jQuery Mobile？

百度蜘蛛爬行CSS和JS很多，这会不会浪费了蜘蛛的资源

javascript 蜘蛛JD-书