并发编程笔记
Posted 吹灭读书灯 一身都是月
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了并发编程笔记相关的知识,希望对你有一定的参考价值。
面试题
- 【四万字】Java并发六十问,图文详解,快来看看你会多少道!
- 不可不说的Java“锁”事 - 美团技术团队 (meituan.com)
- 缺异步编程+并发之非共享模型
- 线程池还没有看完
一、基本概念
1、进程与线程
进程
- 程序由指令和数据组成,但这些指令要运行,数据要读写,就必须将指令加载至 CPU,数据加载至内存。在指令运行过程中还需要用到磁盘、网络等设备。进程就是用来加载指令、管理内存、管理 IO 的。
- 当一个程序被运行,从磁盘加载这个程序的代码至内存,这时就开启了一个进程。
- 进程就可以视为程序的一个实例。大部分程序可以同时运行多个实例进程(例如记事本、画图、浏览器 等),也有的程序只能启动一个实例进程(例如网易云音乐、360 安全卫士等)
线程
- 一个进程之内可以分为一到多个线程。
- 一个线程就是一个指令流,将指令流中的一条条指令以一定的顺序交给 CPU 执行 。
- Java 中,线程作为最小调度单位,进程作为资源分配的最小单位。 在 windows 中进程是不活动的,只是作 为线程的容器
二者对比
- 进程基本上相互独立的,而线程存在于进程内,是进程的一个子集 进程拥有共享的资源,如内存空间等,供其内部的线程共享
- 进程间通信较为复杂 同一台计算机的进程通信称为 IPC(Inter-process communication)
- 不同计算机之间的进程通信,需要通过网络,并遵守共同的协议,例如 HTTP
- 线程通信相对简单,因为它们共享进程内的内存,一个例子是多个线程可以访问同一个共享变量 线程更轻量,线程上下文切换成本一般上要比进程上下文切换低
进程和线程的切换
上下文切换
内核为每一个进程维持一个上下文。**上下文就是内核重新启动一个被抢占的进程所需的状态。**包括以下内容:
- 通用目的寄存器
- 浮点寄存器
- 程序计数器
- 用户栈
- 状态寄存器
- 内核栈
- 各种内核数据结构:比如描绘地址空间的页表,包含有关当前进程信息的进程表,以及包含进程已打开文件的信息的文件表
进程切换和线程切换的主要区别
最主要的一个区别在于进程切换涉及虚拟地址空间的切换而线程不会。因为每个进程都有自己的虚拟地址空间,而线程是共享所在进程的虚拟地址空间的,因此同一个进程中的线程进行线程切换时不涉及虚拟地址空间的转换
页表查找是一个很慢的过程,因此通常使用cache来缓存常用的地址映射,这样可以加速页表查找,这个cache就是快表TLB(translation Lookaside Buffer,用来加速页表查找)。由于每个进程都有自己的虚拟地址空间,那么显然每个进程都有自己的页表,那么当进程切换后页表也要进行切换,页表切换后TLB就失效了,cache失效导致命中率降低,那么虚拟地址转换为物理地址就会变慢,表现出来的就是程序运行会变慢,而线程切换则不会导致TLB失效,因为线程线程无需切换地址空间,因此我们通常说线程切换要比较进程切换快
而且还可能出现缺页中断,这就需要操作系统将需要的内容调入内存中,若内存已满则还需要将不用的内容调出内存,这也需要花费时间
为什么TLB能加快访问速度
快表可以避免每次都对页号进行地址的有效性判断。快表中保存了对应的物理块号,可以直接计算出物理地址,无需再进行有效性检查
2、并发与并行
并发是一个CPU在不同的时间去不同线程中执行指令。
并行是多个CPU同时处理不同的线程。
单核 cpu 下,线程实际还是 串行执行
的。操作系统中有一个组件叫做任务调度器,将 cpu 的时间片(windows 下时间片最小约为 15 毫秒)分给不同的程序使用,只是由于 cpu 在线程间(时间片很短)的切换非常快,人类感 觉是 同时运行的 。总结为一句话就是: 微观串行,宏观并行
,
一般会将这种 线程轮流使用 CPU
的做法称为并发, concurrent
- 并发:两个或多个事件在同一时间间隔内发生,宏观地看是同时发生。
- 并行:两个或多个事件在同一时刻发生,只有多核才能并行。
3、应用-异步调用
以调用方角度来讲,如果
- 需要等待结果返回,才能继续运行就是同步
- 不需要等待结果返回,就能继续运行就是异步
1、设计
多线程可以让方法执行变为异步的(即不要巴巴干等着)比如说读取磁盘文件时,假设读取操作花费了 5 秒钟,如 果没有线程调度机制,这 5 秒 cpu 什么都做不了,其它代码都得暂停…
2、结论
- 比如在项目中,视频文件需要转换格式等操作比较费时,这时开一个新线程处理视频转换,避免阻塞主线程
- tomcat 的异步 servlet 也是类似的目的,让用户线程处理耗时较长的操作,避免阻塞
- tomcat 的工作线程 ui 程序中,开线程进行其他操作,避免阻塞 ui 线程
实验结论:
- 单核 cpu 下,多线程不能实际提高程序运行效率,只是为了能够在不同的任务之间切换,不同线程轮流使用 cpu ,不至于一个线程总占用 cpu,别的线程没法干活
- 多核 cpu 可以并行跑多个线程,但能否提高程序运行效率还是要分情况的
- 有些任务,经过精心设计,将任务拆分,并行执行,当然可以提高程序的运行效率。但不是所有计算任 务都能拆分(参考后文的【阿姆达尔定律】)
- 也不是所有任务都需要拆分,任务的目的如果不同,谈拆分和效率没啥意义
- IO 操作不占用 cpu,只是我们一般拷贝文件使用的是【阻塞 IO】,这时相当于线程虽然不用 cpu,但需要一 直等待 IO 结束,没能充分利用线程。所以才有后面的【非阻塞 IO】和【异步 IO】优化
二、线程的创建
1、创建一个线程(非主线程)
方法一:通过继承Thread创建线程
public class CreateThread
public static void main(String[] args)
Thread myThread = new MyThread();
// 启动线程
myThread.start();
//【继承Thread并重写run()方法】
class MyThread extends Thread
@Override
public void run()
System.out.println("my thread running...");
使用继承方式的好处是,在run()方法内获取当前线程直接使用this就可以了,无须使用Thread.currentThread()方法;不好的地方是Java不支持多继承,如果继承了Thread类,那么就不能再继承其他类。另外任务与代码没有分离,当多个线程执行一样的任务时需要多份任务代码
方法二:使用Runnable配合Thread(推荐)
public class Test2
public static void main(String[] args)
//创建线程任务
Runnable r = new Runnable()
@Override
public void run()
System.out.println("Runnable running");
;
//将Runnable对象传给Thread
Thread t = new Thread(r);
//启动线程
t.start();
或者
public class CreateThread2
private static class MyRunnable implements Runnable
@Override
public void run()
System.out.println("my runnable running...");
public static void main(String[] args)
MyRunnable r = new MyRunnable();
Thread thread = new Thread(r);
thread.start();
通过实现Runnable接口,并且实现run()方法。在创建线程时作为参数传入该类的实例即可
方法二的简化:使用lambda表达式简化操作
当一个接口带有@FunctionalInterface
注解时,是可以使用lambda来简化操作的
所以方法二中的代码可以被简化为
public class Test2
public static void main(String[] args)
//创建线程任务
Runnable r = () ->
//直接写方法体即可
System.out.println("Runnable running");
System.out.println("Hello Thread");
;
//将Runnable对象传给Thread
Thread t = new Thread(r);
//启动线程
t.start();
原理之 Thread 与 Runnable 的关系
分析 Thread 的源码,理清它与 Runnable 的关系
小结
- 方法1 是把线程和任务合并在了一起
- 方法2 是把线程和任务分开了
- 用 Runnable 更容易与线程池等高级 API 配合 用 Runnable 让任务类脱离了 Thread 继承体系,更灵活
方法三:使用FutureTask与Thread结合
使用FutureTask
可以用泛型指定线程的返回值类型(Runnable的run方法没有返回值)
public class Test3
public static void main(String[] args) throws ExecutionException, InterruptedException
//需要传入一个Callable对象
FutureTask<Integer> task = new FutureTask<Integer>(new Callable<Integer>()
@Override
public Integer call() throws Exception
System.out.println("线程执行!");
Thread.sleep(1000);
return 100;
);
Thread r1 = new Thread(task, "t2");
r1.start();
//获取线程中方法执行后的返回结果
System.out.println(task.get());
或
public class UseFutureTask
public static void main(String[] args) throws ExecutionException, InterruptedException
FutureTask<String> ft = new FutureTask<>(new MyCall());
Thread thread = new Thread(ft);
thread.start();
// 获得线程运行后的返回值
System.out.println(ft.get());
class MyCall implements Callable<String>
@Override
public String call() throws Exception
return "hello world";
总结
使用继承方式的好处是方便传参,你可以在子类里面添加成员变量,通过set方法设置参数或者通过构造函数进行传递,而如果使用Runnable方式,则只能使用主线程里面被声明为final的变量。不好的地方是Java不支持多继承,如果继承了Thread类,那么子类不能再继承其他类,而Runable则没有这个限制。前两种方式都没办法拿到任务的返回结果,但是Futuretask方式可以
查看进程线程的方法
windows
- tasklist | findstr java查看进程
- taskkill 杀死进程
linux
-
ps -fe 查看所有进程
-
- ps -fe | grep java
-
ps -fT -p 查看某个进程(PID)的所有线程
-
kill 杀死进程
-
top 按大写 H 切换是否显示线程
-
top -H -p 查看某个进程(PID)的所有线程
Java
-
jps 命令查看所有 Java 进程
-
jstack 查看某个 Java 进程(PID)的所有线程状态
-
jconsole 来查看某个 Java 进程中线程的运行情况(图形界面)
2、原理之线程运行
栈与栈帧
Java Virtual Machine Stacks (Java 虚拟机栈) 我们都知道 JVM 中由堆、栈、方法区所组成,其中栈内存是给谁用的呢?
- 其实就是线程,每个线程启动后,虚拟机就会为其分配一块栈内存
- 每个栈由多个栈帧(Frame)组成,对应着每次方法调用时所占用的内存
- 每个线程只能有一个活动栈帧,对应着当前正在执行的那个方法
栈帧图解
线程上下文切换(Thread Context Switch)
因为以下一些原因导致 cpu 不再执行当前的线程,转而执行另一个线程的代码
- 线程的 cpu 时间片用完
- 垃圾回收 (暂停所有的工作线程STW)
- 有更高优先级的线程需要运行
- 线程自己调用了 sleep、yield、wait、join、park、synchronized、lock 等方法
当 Context Switch 发生时,需要由操作系统保存当前线程的状态(保存现场信息),并恢复另一个线程的状态,Java 中对应的概念 就是程序计数器(Program Counter Register),它的作用是记住下一条 jvm 指令的执行地址,是线程私有的
- 状态包括程序计数器、虚拟机栈中每个栈帧的信息,如局部变量、操作数栈、返回地址等
- Context Switch 频繁发生会影响性能
3、常用方法
方法名 | static | 功能说明 | 注意 |
---|---|---|---|
start() | 启动一个新线 程,在新的线程 运行 run 方法 中的代码 | start 方法只是让线程进入就绪,里面代码不一定立刻 运行(CPU 的时间片还没分给它)。每个线程对象的 start方法只能调用一次,如果调用了多次会出现 IllegalThreadStateException | |
run() | 新线程启动后会 调用的方法 | 如果在构造 Thread 对象时传递了 Runnable 参数,则 线程启动后会调用 Runnable 中的 run 方法,否则默 认不执行任何操作。但可以创建 Thread 的子类对象, 来覆盖默认行为 | |
join() | 等待线程运行结束 | ||
join(long n) | 等待线程运行结束,最多等待 n 毫秒 | ||
getId() | 获取线程长整型 的 id | id 唯一 | |
getName() | 获取线程名 | ||
setName(String) | 修改线程名 | ||
getPriority() | 获取线程优先级 | ||
setPriority(int) | 修改线程优先级 | java中规定线程优先级是1~10 的整数,较大的优先级 能提高该线程被 CPU 调度的机率 | |
getState() | 获取线程状态 | Java 中线程状态是用 6 个 enum 表示,分别为: NEW, RUNNABLE, BLOCKED, WAITING, TIMED_WAITING, TERMINATED | |
isInterrupted() | 判断是否被打 断, | 不会清除 打断标记 | |
isAlive() | 线程是否存活 (还没有运行完 毕) | ||
interrupt() | 打断线程 | 如果被打断线程正在 sleep,wait,join 会导致被打断 的线程抛出 InterruptedException,并清除 打断标 记 ;如果打断的正在运行的线程,则会设置 打断标 记 ;park 的线程被打断,也会设置 打断标记 | |
interrupted() | static | 判断当前线程是 否被打断 | 会清除打断标记 |
currentThread() | static | 获取当前正在执 行的线程 |
sleep(long n) | static | 让当前执行的线 程休眠n毫秒, 休眠时让出 cpu 的时间片给其它 线程 | |
---|---|---|---|
yield() | static | 提示线程调度器 让出当前线程对 CPU的使用 | 主要是为了测试和调试 |
1. start() vs run()
被创建的Thread对象直接调用重写的run方法时, run方法是在主线程main
中被执行的,而不是在我们所创建的线程中执行。所以如果想要在所创建的线程中执行run方法,需要使用Thread对象的start方法。
2. sleep()与yield()
sleep (使线程阻塞)
-
调用 sleep 会让当前线程从 Running 进入
Timed Waiting
状态(阻塞),可通过state()方法查看 -
其它线程可以使用
interrupt()
方法打断正在睡眠的线程,这时 sleep 方法会抛出 InterruptedException【拔氧气瓶】 -
睡眠结束后的线程未必会立刻得到执行
-
建议用 TimeUnit 的 sleep 代替 Thread 的 sleep 来获得更好的可读性 。如:
//休眠一秒 TimeUnit.SECONDS.sleep(1);//"有时限等待" //休眠一分钟 TimeUnit.MINUTES.sleep(1);
yield (让出当前线程)
- 调用 yield 会让当前线程从
Running
进入Runnable
就绪状态(仍然有可能被执行),然后调度执行其它线程 - 具体的实现依赖于操作系统的任务调度器
线程优先级
-
线程优先级会提示(hint)调度器优先调度该线程,但它仅仅是一个提示,调度器可以忽略它
-
如果 cpu 比较忙,那么优先级高的线程会获得更多的时间片,但 cpu 闲时,优先级几乎没作用
-
设置方法:
thread1.setPriority(Thread.MAX_PRIORITY); //设置为优先级最高
案例-防止CPU占用100%
在没有利用 cpu 来计算时,不要让 while(true) 空转浪费 cpu,这时可以使用 yield 或 sleep 来让出 cpu 的使用权给其他程序
while(true)
try
Thread.sleep(50);
catch (InterruptedException e)
e.printStackTrace();
-
可以用 wait 或 条件变量达到类似的效果
-
不同的是,后两种都需要加锁,并且需要相应的唤醒操作,一般适用于要进行同步的场景
-
sleep 适用于无需锁同步的场景
3. join()方法
用于等待某个线程结束。哪个线程内调用join()方法,就等待哪个线程结束,然后再去执行其他线程。
如在主线程中调用t1.join(),则是主线程等待t1线程结束
理解为main方法等待t1插进来(join)
Thread t1 = new Thread();
//等待thread线程执行结束
t1.join();
//最多等待1000ms,如果1000ms内线程执行完毕,则会直接执行下面的语句,不会等够1000ms.超过时间则会继续往下执行
t1.join(1000);
4. interrupt()方法
用于打断阻塞(sleep wait join
…)的线程。 处于阻塞状态的线程,CPU不会给其分配时间片。
- 如果一个线程在在运行中被打断,打断标记会被置为true。
- 如果是打断因sleep wait join方法而被阻塞的线程,会将打断标记置为false
//用于查看打断标记,返回值被boolean类型
t1.isInterrupted();
正常运行的线程在被打断后,不会停止,会继续执行。如果要让线程在被打断后停下来,需要使用打断标记来判断。
while(true)
if(Thread.currentThread().isInterrupted())
break;
*interrupt方法的应用——两阶段终止模式
优化参考下文:两阶终止模式-优化
在一个线程 T1 中如何“优雅”终止线程 T2?这里的【优雅】指的是给 T2 一个料理后事的机会。
1、错误思路
-
使用线程对象的 stop() 方法停止线程
stop 方法会真正杀死线程,如果这时线程锁住了共享资源,那么当它被杀死后就再也没有机会释放锁,其它线程将永远无法获取锁 -
使用 System.exit(int) 方法停止线程
目的仅是停止一个线程,但这种做法会让整个程序都停止
2、两阶段终止模式
代码
public class Test7
public static void main(String[] args) throws InterruptedException
Monitor monitor = new Monitor();
monitor.start();
Thread.sleep(3500);
monitor.stop();
class Monitor
Thread monitor;
//启动监控器线程
public void start()
//设置线控器线程,用于监控线程状态
monitor = new Thread()
@Override
public void run()
//开始不停的监控
while (true)
//判断当前线程是否被打断了
if(Thread.currentThread().isInterrupted())
System.out.println("处理后续任务");
//终止线程执行
break;
System.out.println("监控器运行中...");
try
//线程休眠
Thread.sleep(1000);
catch (InterruptedException e)
e.printStackTrace();
//如果是在休眠sleep的时候被打断,不会将打断标记设置为true,这时要重新设置打断标记
Thread.currentThread().interrupt();
;
monitor.start();
// 用于停止监控器线程
public void stop()
//打断线程
monitor.interrupt();
5. 不推荐使用的打断方法
- stop方法 强制停止线程运行(可能造成共享资源无法被释放,其他线程无法使用这些共享资源;容易破坏同步代码快,造成死锁)
- suspend(暂停线程)/resume(恢复线程)方法
6. 主线程与守护线程
默认情况下,Java 进程需要等待所有线程都运行结束,才会结束。有一种特殊的线程叫做守护线程,只要其它非守护线程运行结束了,即使守护线程的代码没有执行完,也会强制结束。
当JAVA进程中有多个线程在执行时,只有当所有非守护线程都执行完毕后,JAVA进程才会结束。但当非守护线程全部执行完毕后,守护线程无论是否执行完毕,也会一同结束。
//将线程设置为守护线程, 默认为false
monitor.setDaemon(true);
守护线程的应用
- 垃圾回收器线程就是一种守护线程
- Tomcat 中的 Acceptor 和 Poller 线程都是守护线程,所以 Tomcat 接收到 shutdown 命令后,不会等 待它们处理完当前请求
4、线程的状态
1. 五种状态
这是从 操作系统 层面来描述的
- 【初始状态】仅是在语言层面创建了线程对象,还未与操作系统线程关联(例如new了线程对象,没有调用start方法)
- 【可运行状态】(就绪状态)指该线程已经被创建(与操作系统线程关联),可以由 CPU 调度执行 “线程所需要的资源(内存)已经拿到了,但是CPU资源还没有拿到”
- 【运行状态】指获取了 CPU 时间片运行中的状态
- 当 CPU 时间片用完,会从【运行状态】转换至【可运行状态】,会导致线程的上下文切换
- 【阻塞状态】
- 如果调用了阻塞 API,如 BIO 读写文件,这时该线程实际不会用到 CPU,会导致线程上下文切换,进入 【阻塞状态】
- 等 BIO 操作完毕,会由操作系统唤醒阻塞的线程,转换至【可运行状态】
- 与【可运行状态】的区别是,对【阻塞状态】的线程来说只要它们一直不唤醒,调度器就一直不会考虑调度它们
- 【终止状态】表示线程已经执行完毕,生命周期已经结束,不会再转换为其它状态
2. 六种状态
这是从 Java API 层面来描述的
根据 Thread.State 枚举,分为六种状态
-
NEW 线程刚被创建,但是还没有调用 start() 方法
-
RUNNABLE 当调用了 start() 方法之后,注意,Java API 层面的 RUNNABLE 状态涵盖了操作系统层面的 【可运行状态】、【运行状态】和【阻塞状态(例如阻塞API读取文件)】(由于 BIO 导致的线程阻塞,在 Java 里无法区分,仍然认为 是可运行)
-
BLOCKED , WAITING , TIMED_WAITING 都是 Java API 层面对【阻塞状态】的细分,如sleep就为TIMED_WAITING, join为WAITING状态。后面会在状态转换一节详述。
-
-
BLOCKED :“这种状态是指一个阻塞线程在等待monitor锁”;(当线程调用Object#
wait()
方法进入一个synchronized块/方法或重进入一个synchronized锁/方法时会等待获取monitor锁。) -
WAITING :“一个线程在等待另一个线程执行一个动作时在这个状态”。小贴士:当线程调用以下方法时会进入WAITING状态:
- Object#wait() 而且不加超时参数
- Thread#join() 而且不加超时参数
- LockSupport#park()
-
“一个线程在一个特定的等待时间内等待另一个线程完成一个动作会在这个状态”。小贴士:调用了以下方法的线程会进入TIMED_WAITING:
- Thread#sleep()
- Object#wait() 并加了超时参数
- Thread#join() 并加了超时参数
- LockSupport#parkNanos()
- LockSupport#parkUntil()
-
-
-
TERMINATED 当线程代码运行结束
三、共享模型之管程
3.1 共享带来的问题
3.1.1 临界区 Critical Section
- 一个程序运行多个线程本身是没有问题的
- 问题出在多个线程访问共享资源
- 多个线程读共享资源其实也没有问题
- 在多个线程对共享资源读写操作时发生指令交错,就会出现问题
- 一段代码块内如果存在对共享资源的多线程读写操作,称这段代码块为临界区
例如,下面代码中的临界区
static int counter = 0;
static void increment()
// 临界区
counter++;
static void decrement()
// 临界区
counter--;
3.1.2 竞态条件 Race Condition
计算机运行过程中,并发、无序、大量的进程在使用有限、独占、不可抢占的资源,由于进程无限,资源有限,产生矛盾,这种矛盾称为竞争(Race)。
由于两个或者多个进程竞争使用不能被同时访问的资源,使得这些进程有可能因为时间上推进的先后原因而出现问题,这叫做竞争条件(Race Condition)。
多个线程在临界区内执行,由于代码的执行序列不同而导致结果无法预测,称之为发生了竞态条件
2、synchronized 解决方案
1. 解决手段
为了避免临界区的竞态条件发生,有多种手段可以达到目的。
- 阻塞式的解决方案:synchronized,Lock
- 非阻塞式的解决方案:原子变量
本次课使用阻塞式的解决方案:synchronized,来解决上述问题,即俗称的**【对象锁】**,它采用互斥的方式让同一 时刻至多只有一个线程能持有【对象锁】,其它线程再想获取这个【对象锁】时就会阻塞住(blocked
)。这样就能保证拥有锁 的线程可以安全的执行临界区内的代码,不用担心线程上下文切换
注意:
虽然 java 中互斥和同步都可以采用 synchronized 关键字来完成,但它们还是有区别的:互斥是保证临界区的竞态条件发生,同一时刻只能有一个线程执行临界区代码
同步是由于线程执行的先后、顺序不同、需要一个线程等待其它线程运行到某个点
2. synchronized语法
synchronized(对象) //线程1获得了此对象锁,那么线程2就无法获得锁了
//临界区
//注意锁的这个对象是共享变量,如果是局部变量:《逃逸分析之锁消除》
//(因为此时这把锁是局部的没有共享(局部变量没有逃逸出去),在当前线程乃至方法内有效,别的线程根本拿不到,也就锁不到别人,是一把没有意义的锁,JIT发现了就要消除这个锁)
例:
static int counter = 0;
//创建一个公共对象,作为对象锁的对象
static final Object room = new Object();
public static void main(String[] args) throws InterruptedException
Thread t1 = new Thread(() ->
for (int i = 0; i < 5000; i++)
synchronized (room) 以上是关于并发编程笔记的主要内容,如果未能解决你的问题,请参考以下文章
并发编程-AQS同步组件之 CyclicBarrier 同步屏障
Java Review - 并发编程_ 回环屏障CyclicBarrier原理&源码剖析