asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo
Posted hellangels333
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo相关的知识,希望对你有一定的参考价值。
import asyncio from pyppeteer import launch from pyquery import PyQuery as pq async def main(): browser = await launch() page = await browser.newPage() await page.goto(‘https://dynamic2.scrape.cuiqingcai.com/‘) await page.waitForSelector(‘.item .name‘) j_result1 = await page.J(‘.item .name‘) j_result2 = await page.querySelector(‘.item .name‘) jj_result1 = await page.JJ(‘.item .name‘) jj_result2 = await page.querySelectorAll(‘.item .name‘) print(‘J Result1:‘, j_result1) print(‘J Result2:‘, j_result2) print(‘JJ Result1:‘, jj_result1) print(‘JJ Result2:‘, jj_result2) await browser.close() asyncio.get_event_loop().run_until_complete(main())
以上是关于asyncio多进程+pyppeteer浏览器控制+pyquery解析实现爬虫demo的主要内容,如果未能解决你的问题,请参考以下文章
python 多进程和多线程3 —— asyncio - 异步IO
Python有了asyncio和aiohttp在爬虫这类型IO任务中多线程/多进程还有存在的必要吗?