Linux基础21 进程介绍, 进程监控状态ps, 进程相关命令pstree,pgrep,pidof, 动态进程监控top, 进程中断概念, kill停止进程信号介绍pkill, killall
Posted 战斗小人
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux基础21 进程介绍, 进程监控状态ps, 进程相关命令pstree,pgrep,pidof, 动态进程监控top, 进程中断概念, kill停止进程信号介绍pkill, killall相关的知识,希望对你有一定的参考价值。
1.进程的管理:
当我们运行一个程序,那么我们将该程序叫进程
进程 线程 协程
linux起服务会有给这个服务预分配的内存结构, windows没有
2.为什么要学进程管理?
为了管理架构的服务
3.程序和进程的区别
1)程序:开发写出来的代码,程序是永久存在的。
2)进程:它会随着程序的终止而销毁。
4.进程的生命周期
1.当父进程接收到任务调度时,会通过fork派生子进程来处理,那么子进程会继承父进程的衣钵。
2.子进程在处理任务代码时,父进程会进入等待的状态...(等待子进程给父进程返回结果)
3.如果子进程在处理任务过程中,父进程退出了,子进程没有退出,那么这些子进程就没有父进程来管理了,就变成了僵尸进程。
4.每个进程都会有自己的PID号,(process id)子进程则PPID
5.进程管理命令(静态管理):ps
a:显示所有与终端相关的进程
u:显示用户
x:显示所有与终端无关的进程
#用户 USER #进程号 PID #占CPU的百分比 %CPU #占内存的百分比 %MEM #虚拟内存 VSZ #物理内存 RSS #该进程在哪个终端运行 TTY tty1: 物理机的终端 pts/0: 远程连接的终端 ?: 内核运行的终端 #状态 STAT S:进入睡眠状态的进程 (等cpu处理完成或等待cpu处理) s:父进程 R:正在运行的进程 D:不可中断的进程 (比如磁盘IO无法终端, 除非kill -9强行杀死) N:优先级低 <:优先级高 l:多线程的 +:在前台运行的进程 T:暂停,停止的进程 Z:僵尸进程 ---------------------------- L:页被锁进内存 |:多进程的 #进程启动时间 START #进程使用CPU的时间 TIME #程序运行的命令 (方括号包着的是内核的进程) COMMAND
进程相关的命令:
1.按照某一列排序:
[root@oldboyedu ~]# ps aux --sort vsz
2.指定想查看的列 # o: 指定想要看到的列
[root@oldboyedu ~]# ps axo user,pid,vsz,command [root@oldboyedu ~]# ps axo pid,nice,command # nice优先级
3.查看子进程 # f: 查看子进程
[root@oldboyedu ~]# ps auxf |grep [n]ginx # 本质上,相当于进程中有一个grep [n]ginx,但是查询的时候是,grep nginx(正则表达式的结果) root 119884 0.0 0.1 125108 2256 ? Ss 10:06 0:00 nginx: master process /usr/sbin/nginx nginx 119885 0.0 0.1 125496 3140 ? S 10:06 0:00 \\_ nginx: worker process # 有脐带\\_, 就是子进程 nginx 119886 0.0 0.1 125496 3140 ? S 10:06 0:00 \\_ nginx: worker process nginx 119887 0.0 0.1 125496 3140 ? S 10:06 0:00 \\_ nginx: worker process nginx 119888 0.0 0.1 125496 3140 ? S 10:06 0:00 \\_ nginx: worker process
4.额外命令:pstree
查看进程树: [root@oldboyedu ~]# pstree systemd─┬─NetworkManager───2*[NetworkManager] ├─VGAuthService ├─abrt-watch-log ├─abrtd ├─agetty ├─auditd───auditd ├─crond ├─dbus-daemon───dbus-daemon ├─irqbalance ├─master─┬─pickup │ └─qmgr ├─nginx───4*[nginx] ├─polkitd───6*[polkitd] ├─rsyslogd───2*[rsyslogd] ├─sshd─┬─sshd───bash───pstree │ └─sshd───bash───bash───bash ├─systemd-journal ├─systemd-logind ├─systemd-udevd ├─tuned───4*[tuned] ├─vmtoolsd───vmtoolsd └─vsftpd
pgrep
#默认不加选项是查看进程的pid pgrep(了解)
[root@oldboyedu ~]# pgrep -l -a nginx [root@oldboyedu ~]# pgrep sshd # 展示pid 119346 120226 120254 [root@oldboyedu ~]# pgrep -l sshd # 追加名字 119346 sshd 120226 sshd 120254 sshd [root@oldboyedu ~]# pgrep -l -a sshd # 追加命令 119346 /usr/sbin/sshd -D 120226 sshd: root@pts/0 120254 sshd: root@pts/1 [root@oldboyedu ~]# pgrep -u root # 以root用户运行 -a:查看进程的运行命令 -l:查看进程名字 -u:指定用户
pidof
[root@oldboyedu ~]# pidof sshd # 列出pid 120254 120226 119346 [root@oldboyedu ~]# pidof nginx|xargs -n 1 kill -9 # 通过pidof名直接杀掉进程, xargs -n竖着排序, 一行显示几个 [root@oldboyedu ~]# pidof nginx|xargs kill -9 # 通过pidof名直接杀掉进程
5.top命令 (htop命令可以点击)
第一行内容: 当前系统时间 服务器运行时间 有3个用户在登录 top - 10:54:23 up 1 day, 17:56, 3 users, #平均负载(系统包含cpu和io) load average: 0.00, 0.01, 0.05 第二行内容: 总共122个任务 1个正在运行(R) 121个进入睡眠状态的(S) 没有停止(T) 0个僵尸进程(Z) Tasks: 122 total, 1 running, 121 sleeping, 0 stopped, 0 zombie 第三行内容: 用户态 内核态 优先级 cpu空闲 等待进程占用cpu(wait) 硬中断(硬中断请求占cpu百分比) 软中断(软中断请求占cpu百分比) 虚拟机占用物理机CPU的百分比 %Cpu(s): 0.1 us, 0.1 sy, 0.0 ni, 99.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st 用户态: 用户进程占cpu多少 linux上可以用的虚拟机软件: kvm,virtualbox 硬中断和软中断在企业中不用看这两个值 第四行:内存 缓冲区/缓存区 KiB Mem : 2028116 total, 150780 free, 144108 used, 1733228 buff/cache 第五行:swap虚拟内存 KiB Swap: 2097148 total, 2097148 free, 0 used. 1645080 avail Mem 第六行: 进程号 用户 优先级 虚拟内存 物理内存 共享内存 状态 占CPU的百分比 占内存的百分比 PID USER PR NI VIRT RES SHR S %CPU %MEM 运行时间 进程的运行命令 TIME+ COMMAND
top命令使用
-d:指定刷新时间 # top -d 1 -p:指定pid # top -p 122252 查看pid为122252的进程 top -p 122252,122253 查看2个pid进程 -u:指定用户 # top -u root 查看用户为root的进程 -b:保存到文件中 # top -d 1 -u postfix -b -n 2 > /tmp/top.txt 将2次显示的信息保存到top.txt -n:指定次数 z:高亮显示 # 按一次高亮显示,再按一次退出高亮 b:运行的进程,高亮显示 1: 显示各个cpu使用情况 # 初始是显示所有cpu的平均情况 s:修改刷新时间 M:按照内存排序 P:按照CPU排序 R:倒叙 f:自定义显示字段 # 然后按空格选择是够要显示该列, 按q退出 q:退出 k: 杀进程 # 输入pid, 输入信号9
中断
中断:硬中断
中断是系统用来影响硬件设备请求的一种机制,它会打断进程的正常调度和执行,然后调用内核中的中断处理程序来影响设备的请求
硬中断执行过程中,无法再次接收硬中断请求处理
软中断:
事实上,为了解决中断处理程序执行过长的和丢失中断的问题,Linux将中断处理过程分成了两个阶段:
第一阶段:用来快速处理(硬中断)中断,它在中断禁止模式下运行,主要处理跟硬件紧密相关工作
第二阶段:用来延迟处理第一阶段未完成的工作,通常以内核线程的方式运行。
kill信号管理:
1:重新加载 (不结束进程, 重新加载配置文件) 2:类似于ctrl + c 3:正常终止进程(让进程退出) # nginx等停止都是用该信号 9:强制杀死(少用)(nginx主进程杀死,子进程还在变为僵尸进程) 15:默认信号,进程终止 # kill 122529默认为信号15 ------------------------------------- 18:重新唤起停止的进程 # kill -18 82083 19:直接暂停 # kill -19 82083 20:把进程放到后台并暂停
pkill
-t:指定终端(杀掉终端运行的命令) (tty查终端名字,w查终端的号) # pkill -t pts/2 -9:强制,把终端运行的命令和终端一并杀掉 # pkill -9 -t pts/2
killall
接进程的名字 # killall mysqld, killall sshd (因为程序是后台守护进程的方式启动,所有名字后有d)
Linux shell基础
十九. 和系统运行进程相关的Shell命令:
1. 进程监控命令(ps):
要对进程进行监测和控制,首先必须要了解当前进程的情况,也就是需要查看当前进程,而ps命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行和运行的状态、进程是否结束、进程有没有僵死、哪些进程占用了过多的资源等等。总之大部分信息都是可以通过执行该命令得到的。
ps命令存在很多的命令行选项和参数,然而我们最为常用只有两种形式,这里先给出与它们相关的选项和参数的含义:
选项 | 说明 |
a | 显示终端上的所有进程,包括其他用户的进程。 |
u | 以用户为主的格式来显示程序状况。 |
x | 显示所有程序,不以终端来区分。 |
-e | 显示所有进程。 |
o | 其后指定要输出的列,如user,pid等,多个列之间用逗号分隔。 |
-p | 后面跟着一组pid的列表,用逗号分隔,该命令将只是输出这些pid的相关数据。 |
/> ps aux
root 1 0.0 0.1 2828 1400 ? Ss 09:51 0:02 /sbin/init
root 2 0.0 0.0 0 0 ? S 09:51 0:00 [kthreadd]
root 3 0.0 0.0 0 0 ? S 09:51 0:00 [migration/0]
... ...
/> ps -eo user,pid,%cpu,%mem,start,time,command | head -n 4
USER PID %CPU %MEM STARTED TIME COMMAND
root 1 0.0 0.1 09:51:08 00:00:02 /sbin/init
root 2 0.0 0.0 09:51:08 00:00:00 [kthreadd]
root 3 0.0 0.0 09:51:08 00:00:00 [migration/0]
这里需要说明的是,ps中存在很多和进程性能相关的参数,它们均以输出表格中的列的方式显示出来,在这里我们只是给出了非常常用的几个参数,至于更多参数,我们则需要根据自己应用的实际情况去看ps的man手册。
#以完整的格式显示pid为1(init)的进程的相关数据
/> ps -fp 1
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 05:16 ? 00:00:03 /sbin/init
2. 改变进程优先级的命令(nice和renice):
该Shell命令最常用的使用方式为:nice [-n <优先等级>][执行指令],其中优先等级的范围从-20-19,其中-20最高,19最低,只有系统管理者可以设置负数的等级。
#后台执行sleep 100秒,同时在启动时将其nice值置为19
/> nice -n 19 sleep 100 &
[1] 4661
#后台执行sleep 100秒,同时在启动时将其nice值置为-19
/> nice -n -19 sleep 100 &
[2] 4664
#关注ps -l输出中用黄色高亮的两行,它们的NI值和我们执行是设置的值一致。
/> ps -l
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
4 S 0 2833 2829 0 80 0 - 1739 - pts/2 00:00:00 bash
0 S 0 4661 2833 0 99 19 - 1066 - pts/2 00:00:00 sleep
4 S 0 4664 2833 0 61 -19 - 1066 - pts/2 00:00:00 sleep
4 R 0 4665 2833 1 80 0 - 1231 - pts/2 00:00:00 ps
renice命令主要用于为已经执行的进程重新设定nice值,该命令包含以下几个常用选项:
选项 | 说明 |
-g | 使用程序群组名称,修改所有隶属于该程序群组的程序的优先权。 |
-p | 改变该程序的优先权等级,此参数为预设值。 |
-u | 指定用户名称,修改所有隶属于该用户的程序的优先权。 |
#切换到stephen用户下执行一个后台进程,这里sleep进程将在后台睡眠1000秒。
/> su stephen
/> sleep 1000&
[1] 4812
/> exit #退回到切换前的root用户
#查看已经启动的后台sleep进程,其ni值为0,宿主用户为stephen
/> ps -eo user,pid,ni,command | grep stephen
stephen 4812 0 sleep 1000
root 4821 0 grep stephen
#以指定用户的方式修改该用户下所有进程的nice值
/> renice -n 5 -u stephen
500: old priority 0, new priority 5
#从再次执行ps的输出结果可以看出,该sleep后台进程的nice值已经调成了5
/> ps -eo user,pid,ni,command | grep stephen
stephen 4812 5 sleep 1000
root 4826 0 grep stephen
#以指定进程pid的方式修改该进程的nice值
/> renice -n 10 -p 4812
4812: old priority 5, new priority 10
#再次执行ps,该sleep后台进程的nice值已经从5变成了10
/> ps -eo user,pid,ni,command | grep stephen
stephen 4812 10 sleep 1000
root 4829 0 grep stephen
3. 列出当前系统打开文件的工具(lsof):
lsof(list opened files),其重要功能为列举系统中已经被打开的文件,如果没有指定任何选项或参数,lsof则列出所有活动进程打开的所有文件。众所周知,linux环境中任何事物都是文件,如设备、目录、sockets等。所以,用好lsof命令,对日常的linux管理非常有帮助。下面先给出该命令的常用选项:
选项 | 说明 |
-a | 该选项会使后面选项选出的结果列表进行and操作。 |
-c command_prefix | 显示以command_prefix开头的进程打开的文件。 |
-p PID | 显示指定PID已打开文件的信息 |
+d directory | 从文件夹directory来搜寻(不考虑子目录),列出该目录下打开的文件信息。 |
+D directory | 从文件夹directory来搜寻(考虑子目录),列出该目录下打开的文件信息。 |
-d num_of_fd | 以File Descriptor的信息进行匹配,可使用3-10,表示范围,3,10表示某些值。 |
-u user | 显示某用户的已经打开的文件,其中user可以使用正则表达式。 |
-i | 监听指定的协议、端口、主机等的网络信息,格式为:[proto][@host|addr][:svc_list|port_list] |
#查看打开/dev/null文件的进程。
/> lsof /dev/null | head -n 5
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
init 1 root 0u CHR 1,3 0t0 3671 /dev/null
init 1 root 1u CHR 1,3 0t0 3671 /dev/null
init 1 root 2u CHR 1,3 0t0 3671 /dev/null
udevd 397 root 0u CHR 1,3 0t0 3671 /dev/null
#查看打开22端口的进程
/> lsof -i:22
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
sshd 1582 root 3u IPv4 11989 0t0 TCP *:ssh (LISTEN)
sshd 1582 root 4u IPv6 11991 0t0 TCP *:ssh (LISTEN)
sshd 2829 root 3r IPv4 19635 0t0 TCP bogon:ssh->bogon:15264 (ESTABLISHED)
#查看init进程打开的文件
/> lsof -c init
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
init 1 root cwd DIR 8,2 4096 2 /
init 1 root rtd DIR 8,2 4096 2 /
init 1 root txt REG 8,2 136068 148567 /sbin/init
init 1 root mem REG 8,2 58536 137507 /lib/libnss_files-2.12.so
init 1 root mem REG 8,2 122232 186675 /lib/libgcc_s-4.4.4-20100726.so.1
init 1 root mem REG 8,2 141492 186436 /lib/ld-2.12.so
init 1 root mem REG 8,2 1855584 186631 /lib/libc-2.12.so
init 1 root mem REG 8,2 133136 186632 /lib/libpthread-2.12.so
init 1 root mem REG 8,2 99020 180422 /lib/libnih.so.1.0.0
init 1 root mem REG 8,2 37304 186773 /lib/libnih-dbus.so.1.0.0
init 1 root mem REG 8,2 41728 186633 /lib/librt-2.12.so
init 1 root mem REG 8,2 286380 186634 /lib/libdbus-1.so.3.4.0
init 1 root 0u CHR 1,3 0t0 3671 /dev/null
init 1 root 1u CHR 1,3 0t0 3671 /dev/null
init 1 root 2u CHR 1,3 0t0 3671 /dev/null
init 1 root 3r FIFO 0,8 0t0 7969 pipe
init 1 root 4w FIFO 0,8 0t0 7969 pipe
init 1 root 5r DIR 0,10 0 1 inotify
init 1 root 6r DIR 0,10 0 1 inotify
init 1 root 7u unix 0xf61e3840 0t0 7970 socket
init 1 root 9u unix 0xf3bab280 0t0 11211 socket
在上面输出的FD列中,显示的是文件的File Descriptor number,或者如下的内容:
cwd: current working directory;
mem: memory-mapped file;
mmap: memory-mapped device;
pd: parent directory;
rtd: root directory;
txt: program text (code and data);
文件的File Descriptor number显示模式有:
r for read access;
w for write access;
u for read and write access;
在上面输出的TYPE列中,显示的是文件类型,如:
DIR: 目录
LINK: 链接文件
REG: 普通文件
#查看pid为1的进程(init)打开的文件,其输出结果等同于上面的命令,他们都是init。
/> lsof -p 1
#查看owner为root的进程打开的文件。
/> lsof -u root
#查看owner不为root的进程打开的文件。
/> lsof -u ^root
#查看打开协议为tcp,ip为192.168.220.134,端口为22的进程。
/> lsof -i [email protected]:22
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
sshd 2829 root 3r IPv4 19635 0t0 TCP bogon:ssh->bogon:15264 (ESTABLISHED)
#查看打开/root文件夹,但不考虑目录搜寻
/> lsof +d /root
#查看打开/root文件夹以及其子目录搜寻
/> lsof +D /root
#查看打开FD(0-3)文件的所有进程
/> lsof -d 0-3
#-a选项会将+d选项和-c选项的选择结果进行and操作,并输出合并后的结果。
/> lsof +d .
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
bash 9707 root cwd DIR 8,1 4096 39887 .
lsof 9791 root cwd DIR 8,1 4096 39887 .
lsof 9792 root cwd DIR 8,1 4096 39887 .
/> lsof -a -c bash +d .
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
bash 9707 root cwd DIR 8,1 4096 39887 .
最后需要额外说明的是,如果在文件名的末尾存在(delete),则说明该文件已经被删除,只是还存留在cache中。
4. 进程查找/杀掉命令(pgrep/pkill):
查找和杀死指定的进程, 他们的选项和参数完全相同, 这里只是介绍pgrep。下面是常用的命令行选项:
选项 | 说明 |
-d | 定义多个进程之间的分隔符, 如果不定义则使用换行符。 |
-n | 表示如果该程序有多个进程正在运行,则仅查找最新的,即最后启动的。 |
-o | 表示如果该程序有多个进程正在运行,则仅查找最老的,即最先启动的。 |
-G | 其后跟着一组group id,该命令在搜索时,仅考虑group列表中的进程。 |
-u | 其后跟着一组有效用户ID(effetive user id),该命令在搜索时,仅考虑该effective user列表中的进程。 |
-U | 其后跟着一组实际用户ID(real user id),该命令在搜索时,仅考虑该real user列表中的进程。 |
-x | 表示进程的名字必须完全匹配, 以上的选项均可以部分匹配。 |
-l | 将不仅打印pid,也打印进程名。 |
-f | 一般与-l合用, 将打印进程的参数。 |
#手工创建两个后台进程
/> sleep 1000&
3456
/> sleep 1000&
3457
#查找进程名为sleep的进程,同时输出所有找到的pid
/> pgrep sleep
3456
3457
#查找进程名为sleep的进程pid,如果存在多个,他们之间使用:分隔,而不是换行符分隔。
/> pgrep -d: sleep
3456:3457
#查找进程名为sleep的进程pid,如果存在多个,这里只是输出最后启动的那一个。
/> pgrep -n sleep
3457
#查找进程名为sleep的进程pid,如果存在多个,这里只是输出最先启动的那一个。
/> pgrep -o sleep
3456
#查找进程名为sleep,同时这个正在运行的进程的组为root和stephen。
/> pgrep -G root,stephen sleep
3456
3457
#查找有效用户ID为root和oracle,进程名为sleep的进程。
/> pgrep -u root,oracle sleep
3456
3457
#查找实际用户ID为root和oracle,进程名为sleep的进程。
/> pgrep -U root,oracle sleep
3456
3457
#查找进程名为sleep的进程,注意这里找到的进程名必须和参数中的完全匹配。
/> pgrep -x sleep
3456
3457
#-x不支持部分匹配,sleep进程将不会被查出,因此下面的命令没有结果。
/> pgrep -x sle
#查找进程名为sleep的进程,同时输出所有找到的pid和进程名。
/> pgrep -l sleep
3456 sleep
3457 sleep
#查找进程名为sleep的进程,同时输出所有找到的pid、进程名和启动时的参数。
/> pgrep -lf sleep
3456 sleep 1000
3457 sleep 1000
#查找进程名为sleep的进程,同时以逗号为分隔符输出他们的pid,在将结果传给ps命令,-f表示显示完整格式,-p显示pid列表,ps将只是输出该列表内的进程数据。
/> pgrep -f sleep -d, | xargs ps -fp
UID PID PPID C STIME TTY TIME CMD
root 3456 2138 0 06:11 pts/5 00:00:00 sleep 1000
root 3457 2138 0 06:11 pts/5 00:00:00 sleep 1000
以上是关于Linux基础21 进程介绍, 进程监控状态ps, 进程相关命令pstree,pgrep,pidof, 动态进程监控top, 进程中断概念, kill停止进程信号介绍pkill, killall的主要内容,如果未能解决你的问题,请参考以下文章