asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo

Posted hellangels333

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo相关的知识,希望对你有一定的参考价值。

import asyncio
from pyppeteer import launch
from pyquery import PyQuery as pq
 
async def main():
   browser = await launch()
   page = await browser.newPage()
   await page.goto(https://dynamic2.scrape.cuiqingcai.com/)
   await page.waitForSelector(.item .name)
   j_result1 = await page.J(.item .name)
   j_result2 = await page.querySelector(.item .name)
   jj_result1 = await page.JJ(.item .name)
   jj_result2 = await page.querySelectorAll(.item .name)
   print(J Result1:, j_result1)
   print(J Result2:, j_result2)
   print(JJ Result1:, jj_result1)
   print(JJ Result2:, jj_result2)
   await browser.close()
 
asyncio.get_event_loop().run_until_complete(main())

 

以上是关于asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo的主要内容,如果未能解决你的问题,请参考以下文章

python 多进程和多线程3 —— asyncio - 异步IO

Python有了asyncio和aiohttp在爬虫这类型IO任务中多线程/多进程还有存在的必要吗?

如何通过python3 asyncio reuse_port编写正确的多进程服务器程序?

Python 多处理线程 Asyncio

视图中的 Django asyncio 调用不起作用

pyppeteer 报错-无法连接到浏览器