高性能异步爬虫02

Posted jnhnsnow

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了高性能异步爬虫02相关的知识,希望对你有一定的参考价值。

单线程+异步协程(推荐):

-asyncio的一些关键字的说明:

  • event_loop 事件循环:程序开启一个无限循环,把一些函数注册到事件循环上,当满足事件发生的时候,调用相应的协程函数

  • coroutine 协程:协程对象,指一个使用async关键字定义的函数,它的调用不会立即执行函数,而是会返回一个协程对象。协程对象需要注册到事件循环,由事件循环调用。

  • task 任务:一个协程对象就是一个原生可以挂起的函数,任务则是对协程进一步封装,其中包含了任务的各种状态

  •  

  • async:async定义一个协程

  • awati:await用于挂起阻塞方法执行。

测试1:

import asyncio
async def do_something(sth):
    print("doing %s"%sth)
    print("done")
c = do_something("eating")#该方法不会执行 返回一个协程对象
print(c)

#结果
sys:1: RuntimeWarning: coroutine do_something was never awaited
<coroutine object do_something at 0x0000014EE2EFD1C8>

测试2:

import asyncio
async def do_something(sth):
    print("doing %s"%sth)
    print("done")
c = do_something("eating")#该方法不会执行
loop = asyncio.get_event_loop()#创建loop
loop.run_until_complete(c)#协程对象c 扔到loop中 触发执行

#结果
doing eating
done

测试3(task的使用) 通过loop创建:

import asyncio
async def do_something(sth):
    print("doing %s"%sth)
    print("done")
c = do_something("eating")
loop = asyncio.get_event_loop()
task = loop.create_task(c)
print(task) #pending 未执行
loop.run_until_complete(task)
print(task) #finished 执行完毕

#结果
<Task pending coro=<do_something() running at C:/Users/86155/PycharmProjects/chapter_7/mybs4.py:48>>
doing eating
done
<Task finished coro=<do_something() done, defined at C:/Users/86155/PycharmProjects/chapter_7/mybs4.py:48> result=None>

 

测试4(future的使用)通过 asynico创建: 

import asyncio
async def do_something(sth):
    print("doing %s"%sth)
    print("done")
c = do_something("eating")
loop = asyncio.get_event_loop()
task = asyncio.ensure_future(c)
print(task)
loop.run_until_complete(task)
print(task)
#结果
<Task pending coro=<do_something() running at C:/Users/86155/PycharmProjects/chapter_7/mybs4.py:48>>
doing eating
done
<Task finished coro=<do_something() done, defined at C:/Users/86155/PycharmProjects/chapter_7/mybs4.py:48> result=None>

 

测试5(回调)

import asyncio
async def do_something(sth):
print(‘doing %s‘%sth) ##1
print(‘done‘) ##2
return sth #回调函数中的 result()
def call_bask(task):
print(task.result())
c = do_something(‘running‘)
loop = asyncio.get_event_loop()
task = loop.create_task(c)
#回调函数绑定任务对象
task.add_done_callback(call_bask)
loop.run_until_complete(task)

#结果

doing running
done
running



 

 

  

以上是关于高性能异步爬虫02的主要内容,如果未能解决你的问题,请参考以下文章

Python爬虫--高性能的异步爬虫

高性能异步爬虫

高性能异步爬虫

异步高性能爬虫

高性能异步爬虫

高性能异步爬虫