Python之路--Python基础12--异步IORedisMemcached缓存RabbitMQ队列

Posted tuyereiot

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python之路--Python基础12--异步IORedisMemcached缓存RabbitMQ队列相关的知识,希望对你有一定的参考价值。

一、事件驱动与异步IO

 

  回顾:同步、异步、阻塞、非阻塞

同步:

  所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不会返回。按照这个定义,其实绝大多数函数都是同步调用。但是一般而言,我们在说同步、异步的时候,特指那些需要其他部件协作或者需要一定时间完成的任务。

举例:

1. multiprocessing.Pool下的apply #发起同步调用后,就在原地等着任务结束,根本不考虑任务是在计算还是在io阻塞,总之就是一股脑地等任务结束

2. concurrent.futures.ProcessPoolExecutor().submit(func,).result()

3. concurrent.futures.ThreadPoolExecutor().submit(func,).result()

 

异步:

  异步的概念和同步相对。当一个异步功能调用发出后,调用者不能立刻得到结果。当该异步功能完成后,通过状态、通知或回调来通知调用者。如果异步功能用状态来通知,那么调用者就需要每隔一定时间检查一次,效率就很低(有些初学多线程编程的人,总喜欢用一个循环去检查某个变量的值,这其实是一 种很严重的错误)。如果是使用通知的方式,效率则很高,因为异步功能几乎不需要做额外的操作。至于回调函数,其实和通知没太多区别。

举例:

1. multiprocessing.Pool().apply_async()  #发起异步调用后,并不会等待任务结束才返回,相反,会立即获取一个临时结果(并不是最终的结果,可能是封装好的一个对象)。

2. concurrent.futures.ProcessPoolExecutor(3).submit(func,)

3. concurrent.futures.ThreadPoolExecutor(3).submit(func,)

 

阻塞:

  阻塞调用是指调用结果返回之前,当前线程会被挂起(如遇到io操作)。函数只有在得到结果之后才会将阻塞的线程激活。有人也许会把阻塞调用和同步调用等同起来,实际上他是不同的。对于同步调用来说,很多时候当前线程还是激活的,只是从逻辑上当前函数没有返回而已。

举例:

1. 同步调用:apply一个累计1亿次的任务,该调用会一直等待,直到任务返回结果为止,但并未阻塞住(即便是被抢走cpu的执行权限,那也是处于就绪态);

2. 阻塞调用:当socket工作在阻塞模式的时候,如果没有数据的情况下调用recv函数,则当前线程就会被挂起,直到有数据为止。

 

非阻塞:

  非阻塞和阻塞的概念相对应,指在不能立刻得到结果之前也会立刻返回,同时该函数不会阻塞当前线程。

 

对于一个network IO (这里我们以read举例),它会涉及到两个系统对象,一个是调用这个IO的process (or thread),另一个就是系统内核(kernel)。当一个read操作发生时,该操作会经历两个阶段:

  1)等待数据准备 (Waiting for the data to be ready)

  2)将数据从内核拷贝到进程中(Copying the data from the kernel to the process)

记住这两点很重要,因为这些IO模型的区别就是在两个阶段上各有不同的情况。

 

1、输入操作:read、readv、recv、recvfrom、recvmsg共5个函数,如果会阻塞状态,则会经理wait data和copy data两个阶段,如果设置为非阻塞则在wait 不到data时抛出异常

2、输出操作:write、writev、send、sendto、sendmsg共5个函数,在发送缓冲区满了会阻塞在原地,如果设置为非阻塞,则会抛出异常

3、接收外来链接:accept,与输入操作类似

4、发起外出链接:connect,与输出操作类似

 

 

通常,我们写服务器处理模型的程序时,有以下几种模型:

 

  1、每收到一个请求,创建一个新的进程,来处理该请求;

 

  2、每收到一个请求,创建一个新的线程,来处理该请求;

 

  3、每收到一个请求,放入一个事件列表,让主进程通过非阻塞I/O方式来处理请求

 

上面的几种方式,各有千秋,

 

第1中方法,由于创建新的进程的开销比较大,所以,会导致服务器性能比较差,但实现比较简单。

 

第2种方式,由于要涉及到线程的同步,有可能会面临死锁等问题。

 

第3种方式,在写应用程序代码时,逻辑比前面两种都复杂。

 

综合考虑各方面因素,一般普遍认为第(3)种方式是大多数网络服务器采用的方式

 

 

看图说话讲事件驱动模型

 

在UI编程中,常常要对鼠标点击进行相应,首先如何获得鼠标点击呢?
方式一:创建一个线程,该线程一直循环检测是否有鼠标点击,那么这个方式有以下几个缺点
1. CPU资源浪费,可能鼠标点击的频率非常小,但是扫描线程还是会一直循环检测,这会造成很多的CPU资源浪费;如果扫描鼠标点击的接口是阻塞的呢?
2. 如果是堵塞的,又会出现下面这样的问题,如果我们不但要扫描鼠标点击,还要扫描键盘是否按下,由于扫描鼠标时被堵塞了,那么可能永远不会去扫描键盘;
3. 如果一个循环需要扫描的设备非常多,这又会引来响应时间的问题;
所以,该方式是非常不好的。

方式二:就是事件驱动模型
目前大部分的UI编程都是事件驱动模型,如很多UI平台都会提供onClick()事件,这个事件就代表鼠标按下事件。事件驱动模型大体思路如下:
1. 有一个事件(消息)队列;
2. 鼠标按下时,往这个队列中增加一个点击事件(消息);
3. 有个循环,不断从队列取出事件,根据不同的事件,调用不同的函数,如onClick()、onKeyDown()等;
4. 事件(消息)一般都各自保存各自的处理函数指针,这样,每个消息都有独立的处理函数;

 

 

 

二、阻塞IO(blocking IO)

 

 

以上是关于Python之路--Python基础12--异步IORedisMemcached缓存RabbitMQ队列的主要内容,如果未能解决你的问题,请参考以下文章

目录Python自动化开发之路

Python之路,day5-Python基础

Python之路第三篇:Python基础(12)——函数

Python之路,第十二篇:Python入门与基础12

Python学习之路——基础07篇

python之路二十