Linux--进程

Posted L_add

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux--进程相关的知识,希望对你有一定的参考价值。

冯诺依曼体系系统

我们常见的计算机,服务器大部分都遵循冯诺依曼体系

目前为止,计算机都是由一个个硬件组成

  • 输入单元:键盘,鼠标,扫描仪,话筒,摄像头,网卡,硬盘等
  • 中央处理器(CPU):运算器,控制器等
  • 输出单元:显示器,打印机,音响,网卡,硬盘等

总结:
1、站在硬件角度&&在数据层面上,CPU只和内存打交道,外设只和内存打交道
2、数据要处理,必须预装载到内存中,局部性原理,由操作系统完成预装
程序要运行之前必须得先加载到内存中,为什么?
答:可执行程序 (文件)是在硬盘上(外设)

操作系统

概念:任何计算机系统都包含一个基本的程序集合,称为操作系统(OS),笼统的理解,操作系统包括:

  • 内核(进程管理,内存管理,文件管理,驱动管理)

  • 其它程序(函数库,shell程序等)
    设计OS的目的

  • 与硬件交互,管理所有的软硬件资源

  • 为用户程序(应用程序)提供一个良好的执行环境


总结

计算机管理软件

  • 1、描述,用struct 结构体
  • 2、组织,用链表或其他高效的数据结构

系统调用和库函数概念

  • 在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统提供的接口,叫做系统调用
  • 系统调用在使用上,功能比较基础,对用户的要求相对也比较高,所以开发者对部分系统调用进行封装,从而形成库,有了库,就更有利于开发者进行二次开发

进程

基本概念

  • 概念:程序的一个执行实例,正在执行的程序等
  • 内核观点:担当分配系统资源(CPU时间,内存)的实体

描述进程 PCB

  • 进程信息被放在一个叫做进程控制块的数据结构中,可以理解为进程属性的集合
  • PCB(process control block),Linux下task_struct是PCB的一种

task_struct

  • 在Linux中描述的进程结构体叫 task_struct
  • task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程信息

task_struct内容分类

  • 标示符:描述本进程唯一的标示符,用来区别其他进程 pid ppid
  • 状态:任务状态,退出代码,推出信号等 STAT:S+:休眠 R+:运行 R:后台运行
  • 优先级:相对于其他进程的优先级
  • 程序计数器:程序中即将被执行的下一条指令的地址PC/EIP
  • 内存指针:包括程序代码和进程相关数据的指针,还有其他进程共享的内存块指针
  • 上下文数据:进程执行时处理器的寄存器中的数据
  • I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表
  • 记账信息:可能包括处理时间的总和,使用的时钟数的总和,时间限制,记账号等

问什么要有优先级?
答:CPU资源是有限的,进程可以有多个,进程需要进行优先级设置
如何理解进程排队?
答:PCB结构体排队

PCB以双链表的形式链接,所谓管理进程-》对链表的增删查改

前台进程

在Linux命令行中,只能有一个前台进程。
想要把前台进程变成后台进程:程序+&

删掉后台进程

$ kill -9 +pid的值

组织进程

可以在内核源代码里找到它,所有运行在系统里的进程都以task_struct链表的形式存在内核里

查看进程

进程的信息可以通过/proc系统文件夹查看

大多数进程信息同样可以使用top和ps这些用户级工具来获取

1、找所有进程列表

$ ps aux


2、找指定文件的进程

$ ps aux | grep '文件名'


3、找出某个文件的n行进程

$ ps aux | head -n && ps aux | grep '文件名'

通过系统调用获取进程标识符

  • 进程id(PID)
  • 父进程id(PPID)



通过系统调用创建进程-fork初识

fork创建子进程,fork之前的代码被父进程执行。fork之后的代码默认被父子都可以执行

  • 运行 man fork 认识 fork
  • fork 有两个返回值 给父进程返回子进程的pid,给子进程返回0

  • 父子进程代码共享,数据各自开辟空间,私有一份(采用写时拷贝)
  • fork之后通常要用if 进行分流
    父子进程分流,“同时进行”

进程状态

一个进程可以有几个状态(在Linux内核里,进程有时候也叫任务)

  • R 运行状态(Running):进程不一定在运行中,它表明进程要么是在运行中要么在运行队列里

  • S 睡眠状态(Sleeping):进程在等待事件完成(睡眠有时候也叫可中断睡眠),随时可以被唤醒/杀掉

  • D 磁盘休眠状态(Disk Sleep):有时候也叫不可中断睡眠,在这个状态的进程通常会等到IO的结束,不会被杀掉,即使是操作系统;自动唤醒,才可以恢复

  • T 停止状态(stopped):可以通过发送 SIGSTOP信号给进程来停止(T)进程。这个被暂停的进程可以通过发送SIGCONT让进程继续运行

  • X 死亡状态(dead):这个状态只是一个返回状态,不会在任务列表里看到

进程状态查看

$ ps aux /ps axj

Z(zombie):僵尸进程

  • 僵死状态(zombie):当进程退出并且父进程(使用wait()系统调用)没有读取到子进程退出的返回代码时就会产生僵死进程
  • 僵死进程会以终止状态保持在进程表中,并且会一直在等待父进程读取退出状态代码
    只要子进程退出,父进程还在运行,但父进程没有读取子进程状态,子进程进入Z状态
    进程退出,在系统层面,曾经申请的资源并不是被立即释放,而是要暂存一段时间,供OS(父进程)进行读取

echo $?

  • 命令行中,最近一次进程退出时候的退出码

    进程退出的信息(退出码),会暂时保存(task_struct),如果没人读取,此时,该task_struct相关数据不会被释放

$ while :; do ps aux | head -1 && ps aux | grep myproc;echo"##############"; sleep 1 ; done

僵尸进程的危害

  • 进程的退出状态必须被维持下去,因为需要告诉父进程状态。如果父进程一直不读取,那子进程一直处于Z状态
  • 维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_sturct(PCB)中,Z状态一直不退出,PCB一直需要维护
  • 父进程创建子进程,不回收就会造成内存资源的浪费。因为数据结构对象本身就要占用内存
  • 会造成内存泄漏

孤儿进程

  • 父进程如果提前退出,子进程就称为"孤儿进程"

进程优先级

  • CPU资源分配的先后顺序,就是指进程的优先权
  • 优先权高的进程有优先执行的权力。配置进程优先权对多任务环境的Linux很有用,可以改善系统性能
  • 可以把进程运行到指定的CPU上,这样可把不重要的进程安排到某个CPU,可以改善系统整体性能

查看系统进程

在Linux和Unix系统中,用 ps -l 命令(只能查看当前Xshell登录的进程)

  • UID:代表执行者的身份
  • PID:代表这个进程的代号
  • PPID:代表这个进程的父进程的代号
  • PRI:代表这个进程可被执行的优先级,其值越小越早被执行
  • NI:代表进程的nice值

PRI和NI

  • PRI是进程的优先级,或是程序被CPU执行的先后顺序,值越小,优先级越高
  • NI:nice值,表示进程可被执行的优先级的修正数
  • PRI越小越先执行,加入nice值后,PRI(new)=PRI(old)+nice
  • nice 为负时,优先级值变小,优先级变高,会被越快执行
  • nice取值范围是 -20~19
    Linux下,调整进程优先级,就是调整nice值

查看进程优先级的命令

用top命令更改已存在的进程

  • top
  • 按r->输入进程PID->输入nice值


其他概念

  • 竞争性:系统进程数目众多,而CPU资源只有少量,甚至1个,所以进程之间是具有竞争性的。为了高效完成任务,更合理竞争相关资源,便有了优先级
  • 独立性:多个进程运行,需要独享各种资源,多进程运行期间互不干扰
  • 并行:多个进程在多个CPU下分别,同时运行,这称之为并行
  • 并发:多个进程在一个CPU下采用进程切换的方式,在一段时间内,让多个进程得以推进,称之为并发

以上是关于Linux--进程的主要内容,如果未能解决你的问题,请参考以下文章

linux c 退出进程的代码

在 Python 多处理进程中运行较慢的 OpenCV 代码片段

java 简单的代码片段,展示如何将javaagent附加到运行JVM进程

代码片段:Shell脚本实现重复执行和多进程

LINUX操作系统知识:进程与线程详解

Linux系统进程的知识总结,进程与线程之间的纠葛...