操作系统-2.1-进程
Posted LL.LEBRON
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了操作系统-2.1-进程相关的知识,希望对你有一定的参考价值。
文章目录
操作系统-2.1-进程
1.进程的定义,组成,组织方式,特征
1.1进程的定义
- 程序:就是一个指令序列。早期的计算机(只支持单道程序)。
- 程序的代码放在程序段内,程序运行过程处理的数据放在数据段内(如变量)。
- 系统为每个运行的程序配置一个数据结构,称为进程控制块(PCB),用来描述进程的各种信息(如程序代码存放位置)。
- 程序段、数据段、PCB三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程。例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。注意:PCB是进程存在的唯一标志!。
- 从不同的角度,进程可以有不同的定义,比较传统典型的定义有:
- 进程是程序的一次执行过程。
- 进程是一个程序及其数据在处理机上顺序执行时所发生的活动。
- 进程是具有独立功能的程序在数据集合上运行的过程(强调“动态性”),它是系统进行资源分配和调度的一个独立单位。
- 引入进程实体的概念后,可把进程定义为:
进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。
注:严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。不过,除非题目专门考察二者区别,否则可以认为进程实体就是进程。因此我们也可以说“进程由程序段、数据段、PCB三部分组成”。
1.2进程的组成
-
进程(进程实体):由程序段,数据段,PCB三部分组成。
-
PCB:操作系统通过PCB来管理进程,因此PCB中应该包含操作系统对其进行管理所需的各种信息。
进程的管理者(操作系统)所需的数据都在PCB中。
-
程序段:存放要执行的代码。
-
数据段:存放程序运行过程中处理的各种数据。(如全局变量、局部变量、宏定义的常量就存放在数据段内)。
-
-
PCB的组成
-
进程描述信息
- 进程标识符PID
- 用户标识符UID
当进程被创建时,操作系统会为该进程分配一个唯一的、不重复的ID,用于区分不同的进程(类似于身份证号)。
-
进程控制和管理信息
- 进程当前状态
- 进程优先级
-
资源分配清单
- 程序段指针
- 数据段指针
- 键盘
- 鼠标
-
处理机相关信息
- 各种寄存器值
当进程切换时需要把进程当前的运行情况记录下来保存在
PCB
中,如程序计数器的值表示了当前程序执行到哪一-句。
-
1.3进程的组织方式
在一个系统中,通常有数十、数百乃至数千个
PCB
。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。
注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题
进程的组织方式:
- 链接方式:按照进程状态
PCB
分为多个队列,操作系统持有指向各个队列的指针。 - 索引方式:根据进程状态的不同,建立几张索引表,操作系统持有指向各个索引表的指针。
链接方式的图示:
索引方式的图示:
1.4进程的特征
进程的五个基本特征:
- 动态性:进程是程序的一次执行过程,是动态地产生、变化和消亡的。(动态性是进程最基本的特征。
- 并发性:内存中有多个进程实体,各进程可并发执行。
- 独立性:进程是能独立运行、独立获得资源、独立接受调度的基本单位。进程是资源分配、接受调度的基本单位。
- 异步性:各进程按各自独立的、不可预知的速度向前推进,操作系统要提供"进程同步机制"来解决异步问题。
- 结构性:每个进程都会配置一个PCB。结构上看,进程由程序段、数据段、PCB组成
1.5总结
2.进程的状态与转换
2.1进程的状态
进程是程序的一次执行。在这个执行过程中,有时进程正在被
CPU
处理,有时又需要等待CPU
服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。
-
进程的三种基本状态
-
运行态:占有
CPU
,并在CPU
上运行。注意:单核处理机环境下,每一时刻最多只有一个进程处于运行态。(双核环境下可以同时有两个进程处于运行态)。
-
就绪态:已经具备运行条件,但由于没有空闲
CPU
,而暂时不能运行。进程已经拥有了除处理机之外所有需要的资源,一旦获得处理机,即可立即进入运行态开始运行。
-
阻塞态:又称等待态。因等待某一事件而暂时不能运行。
这里的某一事件如:等待操作系统分配打印机、等待读磁盘操作的结果。
CPU
是计算机中最昂贵的部件,为了提高CPU
的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU
的服务。
-
-
进程的另外两种状态
- 创建态:(新建态)进程正在被创建, 操作系统为进程分配资源,初始化PCB。
- 终止态:(结束态)进程正从系统中撤销,操作系统会回收进程拥有的资源,撤销PCB。
2.2进程状态的转换
进程状态的状态图示:
这里注意一下几点:
- 阻塞态→就绪态表示进程自身控制的,是一种被动行为。
- 运行态→阻塞态是一种自身做出的主动行为。
- 不能由阻塞态直接转换为运行态,也不能由就绪态直接转换为阻塞态(因为进入阻塞态是进程主动请求的,必然需要进程在运行时才能发出这种请求)。
2.3总结
3.进程控制
3.1什么是进程控制?
进程控制的主要功能:是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现
进程状态转换等功能。
简化理解:反正进程控制就是要实现进程状态转换
3.2如何实现进程控制?
用原语实现进程控制。原语的特点是执行期间不允许中断,只能–气呵成。
这种不可被中断的操作即原子操作。
原语采用“关中断指令”和“开中断指令”实现。
显然,关/开中断指令的权限非常大,必然是只允许在核心态下执行的特权指令。
3.3总结
4.进程通信
这节知识整体概述
- 共享存储
- 基于数据结构的共享,
- 基于存储区的共享。
- 消息传递
- 直接通信方式
- 间接通信方式
- 管道通信
4.1什么是进程通信?
-
我们先来看一个问题,什么是进程通信?
顾名思义,进程通信就是指进程之间的信息交换。
-
进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。
为了保证安全,一个进程不能直接访问另一个进程的地址空间。
但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。
- 共享存储
- 消息传递
- 管道通信
4.2进程通信—共享存储
两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。
操作系统只负责提供共享空间和同步互斥工具(如P、V操作)。
- 基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢,限制多,是一种低级通信方式。
- 基于存储区的共享:在内存中画出一块共享存储区。数据的形式,存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。
4.3进程通信—管道通信
管道是指用于连接读写进程的一个共享文件,又名pipe文件,其实就是在内存中开辟一个大小固定的缓冲区。
- 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
- 各进程要互斥地访问管道。
- 数据以字符流的形式写入管道,当管道写满时,写进程的
write()
系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read()
系统调用将被阻塞。 - 如果没写满,就不允许读。如果没读空,就不允许写。
- 数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。
4.4进程通信—消息传递
进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进程数据交换。
4.5总结
5.线程概念和多线程模型
5.1什么是线程,为什么要引入线程?
-
有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。
-
传统的进程是程序执行流的最小单位。引入线程后,线程成为了程序执行流的最小单位。可以把线程理解为“轻量级进程”。
-
线程:是一个基本的CPU执行单元,也是程序执行流的最小单位。
-
引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)。
引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。
5.2线程的出现带来的变化
- 资源分配,调度
- 传统进程机制中,进程是资源分配、调度的基本单位。
- 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。
- 并发性
- 传统进程机制中,只能进程间并发。
- 引入线程后,各线程间也能并发,提升了并发度。
- 系统开销
- 传统的进程间并发,需要切换进程的运行环境,系统开销很大。
- 线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小。
- 引入线程后,并发所带来的系统开销减小。
5.3线程的属性
知道一些重要的属性即可,其他的了解就行。
线程的属性:
- 线程是处理机调度的单位。
- 多CPU计算机中,各个线程可占用不同的CPU。
- 每个线程都有一个线程ID、线程控制块(TCB)。
- 线程也有就绪、阻塞、运行三种基本状态。
- 线程几乎不拥有系统资源。
- 同一进程的不同线程间共享进程的资源。
- 由于共享内存地址空间,同一进程中的线程间通信甚至无需系统干预。
- 同一进程中的线程切换,不会引起进程切换。
- 不同进程中的线程切换,会引起进程切换。
- 切换同进程内的线程,系统开销很小。
- 切换进程,系统开销较大。
5.4线程实现方式
-
用户级线程
- 用户级线程由应用程序通过线程库实现。所有的线程管理工作都由应用程序负责(包括线程切换)。
- 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
- 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。(用户级线程对用户不透明,对操作系统透明)。
- 可以这样理解,“用户级线程” 就是“从用户视角看能看到的线程”。
-
内核级线程
- 内核级线程的管理工作由操作系统内核完成。线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
- 可以这样理解,“内核级线程”就是“从操作系统内核视角看能看到的线程”。
-
两种线程的组合
- 在同时支持用户级线程和内核级线程的系统中,可采用二者组合的方式:将n个用户级线程映射到m个内核级线程上( n>=m)。
- 重点重点重点:操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。
例如:下面这个模型中,该进程由两个内核级线程,三个用户级线程,在用户看来,这个进程中有三个线程。但即使该进程在一个4核处理机的计算机上运行,也最多只能被分配到两个核,最多只能有两个用户线程并行执行。
5.5多线程模型
-
多对一模型
- 多对一模型:多个用户级线程映射到一个内核级线程。每个用户进程只对应一个内核级线程。
- 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
- 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
-
一对一模型
- 一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。
- 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
- 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
-
多对多模型
- 多对多模型:n用户级线程映射到m个内核级线程 (n>=m)。每个用户进程对应m个内核级线程。
- 克服了多对一模型并发度不高的缺点,又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。
5.6总结
以上是关于操作系统-2.1-进程的主要内容,如果未能解决你的问题,请参考以下文章
在 Python 多处理进程中运行较慢的 OpenCV 代码片段