python 进程
Posted Bigberg
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 进程相关的知识,希望对你有一定的参考价值。
参考博客:https://www.cnblogs.com/vamei/archive/2012/10/12/2721484.html
一、前言
Python的线程或进程都是调用操作系统的原生线程或进程,但是由于GIL的存在,python多线程并不能利用cpu多核的优势。而python的进程是不存在GIL的,各个进程间的数据是独立的安全的,所有python多进程可以利用多核优势。
各自适用情况:
python多线程: I/O 操作密集型任务
python多进程: CPU密集型任务
二、multiprocessing
multiprocessing is a package that supports spawning processes using an API similar to the threading module. The multiprocessing package offers both local and remote concurrency, effectively side-stepping the Global Interpreter Lock by using subprocesses instead of threads. Due to this, the multiprocessing module allows the programmer to fully leverage multiple processors on a given machine. It runs on both Unix and Windows. multiprocessing包是Python中的多进程管理包,用类似于线程模块的API来创建进程(multiprocessing的很大一部份与threading使用同一套API,只不过换到了多进程的情境)。 多进程管理包提供本地和远程的并发,通过使用子进程而不是线程有效的避开了GIL 由于这个原因,multiprocessing允许程序员充分利用给定机器上的多个处理器。 它可以在Unix和Windows上运行。
与threading.Thread类似,它可以利用multiprocessing.Process对象来创建一个进程。该进程可以运行在Python程序内部编写的函数。该Process对象与Thread对象的用法相同,也有start(), run(), join()的方法。此外multiprocessing包中也有Lock/Event/Semaphore/Condition类
但在使用这些共享API的时候,我们要注意以下几点:
- 在UNIX平台上,当某个进程终结之后,该进程需要被其父进程调用wait,否则进程成为僵尸进程(Zombie)。所以,有必要对每个Process对象调用join()方法 (实际上等同于wait)。对于多线程来说,由于只有一个进程,所以不存在此必要性。
- multiprocessing提供了threading包中没有的IPC(比如Pipe和Queue),效率上更高。应优先考虑Pipe和Queue,避免使用Lock/Event/Semaphore/Condition等同步方式 (因为它们占据的不是用户进程的资源)。
- 多进程应该避免共享资源。在多线程中,我们可以比较容易地共享资源,比如使用全局变量或者传递参数。在多进程情况下,由于每个进程有自己独立的内存空间,以上方法并不合适。此时我们可以通过共享内存和Manager的方法来共享资源。但这样做提高了程序的复杂度,并因为同步的需要而降低了程序的效率。
Process.PID中保存有PID,如果进程还没有start(),则PID为None。
三、事例
3.1 定义进程
import multiprocessing import time import os def run(name): time.sleep(2) print(\'hello\', name) if __name__ == \'__main__\': start_time = time.time() p_list = [] for i in range(10): p = multiprocessing.Process(target=run, args=(\'bob%s\' % i,)) # 创建一个进程对象 p.start() print(p.name, p.pid) # 进程名 和 pid p_list.append(p) # p.join() # 和线程一样,join会阻塞 for p in p_list: p.join() print(\'parent process\', os.getppid()) print(\'total time\', time.time()-start_time)
3.2 进程中嵌入线程
# -*- coding: UTF-8 -*- import multiprocessing import time import os import threading def threading_run(name): print(\'name:\', name) def run(name): time.sleep(2) t = threading.Thread(target=threading_run, args=(name,)) # 定义线程 t.start() # print(\'hello\', name) if __name__ == \'__main__\': start_time = time.time() for i in range(10): p = multiprocessing.Process(target=run, args=(\'bob%s\' % i,)) # 进程 p.start() # print(p.name, p.pid) print(\'parent process\', os.getppid())
注:和线程一样,主进程也默认不会等待子进程结束
3.3 父进程和子进程
from multiprocessing import Process import os def info(title): print(title) print(\'module name:\', __name__) print(\'parent process:\', os.getppid()) print(\'process id:\', os.getpid()) print("\\n\\n") def f(name): info(\'\\033[31;1mfunction f\\033[0m\') print(\'hello\', name) if __name__ == \'__main__\': info(\'\\033[32;1mmain process line\\033[0m\') p = Process(target=f, args=(\'bob\',)) p.start() p.join()
结果:
main process line module name: __main__ parent process: 2464 process id: 13628 function f module name: __mp_main__ parent process: 13628 process id: 17480 hello bob
注:
parent process: 2464 是我电脑中PyCharm 的进程号
process id: 13628 是 主进程(\'__main__\')的进程号
process id: 17480 是 子进程 p 的进程号
所以可以看出,所有的进程都是由父进程启动的
以上是关于python 进程的主要内容,如果未能解决你的问题,请参考以下文章
java 简单的代码片段,展示如何将javaagent附加到运行JVM进程
使用 asyncio 将 bash 作为 Python 的子进程运行,但 bash 提示被延迟
LINUX PID 1和SYSTEMD PID 0 是内核的一部分,主要用于内进换页,内核初始化的最后一步就是启动 init 进程。这个进程是系统的第一个进程,PID 为 1,又叫超级进程(代码片段