小白科普：线程和线程池

Posted 2021-04-06 码农翻身

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了小白科普：线程和线程池相关的知识，希望对你有一定的参考价值。

软件大师又要给弟子开小灶了，这次是线程和线程池。

软件大师正在闭目修炼，最小的一名弟子慢慢走了进来。

大师，最近我在学习线程，有很多迷惑的地方。

说来听听，让为师给你排解一下。

第一个问题问题就是为什么要多线程啊，我看了操作系统中的多进程管理，不是挺好的吗？多线程似乎没有必要啊！

不错，多问问为什么，总是有好处的。所谓线程，就是程序代码的执行，一个进程至少得有一个线程，要不然，这个进程怎么运行？对吧？

这个我理解。

以你常用的Word为例，假设这个进程没有多线程（或者说它只有一个线程），如果它有个定时保存文档的功能，你想象下，当这个自动保存的功能在运行的时候，你还能继续输入文字吗？

不能

对，这就是问题所在了，单线程只能干一件事情，无法并发和并行。直接导致用户体验不好。CPU快速的运算能力，还有多核，就被浪费了。

那我完全可以用多进程来处理啊，一个进程来接受用户输入文字，另外一个进程来自动保存。

是可以这么做，但进程是个重量级的家伙，并且进程之间是隔离的，他们要想共享数据，例如被编辑的文件内容，那是非常麻烦的。

原来如此。

古人云：进程是拥有资源的基本单位，线程是CPU调度的基本单位，这句话你理解吗？

不是特别明白......

举个例子，有两个进程，一个是Word，一个是QQ音乐。 Word 进程打开了文件，这是它的资源，QQ音乐打开了Socket，这也是它的资源。

假设Word有两个线程：T1负责接受用户的文字输入，T2 负责自动保存。

QQ音乐也有两个线程：T3负责从Socket中读取数据，T4负责对音乐数据进行解码。

操作系统在做调度的时候，基本单位不是Word,QQ音乐这样的进程，而是T1, T2,T3,T4这些线程。明白了吗？

小白科普：线程和线程池

（点头）原来每个线程执行的都是进程代码的某个片段啊！对了，我听师兄们在讨论什么Java多线程编程，说是很复杂，但是他们从来没提到过Java 多进程编程，这是怎么回事啊？

不错，你的师兄们都没有想到这个问题，看来你已经开始思考了。我先问你，你写的Java程序是不是运行在JVM中？对操作系统来说，JVM是个什么东西？

嗯... JVM其实就是java.exe运行起来，那它肯定是个进程了。

那在一个进程中还能进行多进程编程吗？

（恍然大悟）奥，那是肯定不行了，Java程序运行在JVM当中， JVM这个进程其实就是他们的容器。我听说Python, Ruby 等动态语言也都有虚拟机，这么说他们也可以进行多线程编程了。

是啊，虚拟机是个好东西，你们真是遇上了好时候啊，不用再费劲心机去操作内存。这虚拟机还能屏蔽操作系统的差异，你写的程序可以在任意的支持该语言虚拟机的操作系统中运行。可移植性很重要，要不然，你在Mac/Windows上开发的程序怎么能不加修改地放到Linux上去运行呢？

我在Java 中创建了一个Thread对象，为什么要调用start方法才能启动线程？为什么不能直接调用run方法呢？

你要是直接调用run()方法，会是什么效果？

就是用当前线程去执行一个普通函数而已，根本没有什么新线程创建出来。

这就对了，你想创建一个新的线程出来，肯定得有准备工作啊，设置好这个线程的上下文，比如这个线程的栈（用于函数调用），线程的状态，这个线程的PC(Program Counter）等等一系列信息以后，这个线程才可以被调度，一旦被调度，就会执行那个run()方法了。

明白了大师，还有一个问题，既然线程是属于进程的，可以共享进程的资源，那创建一个线程应该很轻松啊，为什么要有线程池这个东西呢？

虽然线程是个轻量级的东西，但是对于互联网应用来说，如果每个用户的请求都创建一个线程，那会非常得多，服务器也是难于承受，再说了，众多的线程去竞争CPU，不断切换，也会让CPU调度不堪重负，很多线程将不得不等待。所以前辈们的思路就是（1）用少量的线程（2）让线程保持忙碌

奥，就是说只创建一定数量的线程，让这些线程去处理所有的任务，任务执行完了以后，线程并不结束，而是回到线程池中去，等待接受下一个任务。

小白科普：线程和线程池

这些线程可以预先创建，任务来了就不用临时再创建了，立刻开始服务。

预先创建？您刚才不是说线程是程序代码的执行吗？它是个动态的东西，怎么可能预先创建？如果真的创建起来了，就会调用run方法，马上执行完了，线程就结束了！

你忘了重要的一点，线程的状态。当线程池的线程刚创建时，让他们进入阻塞状态：等待某个任务的到来。如果任务来了，那就好办，唤醒其中一个线程，让它拿到任务去执行即可。

可是怎么让他们进入阻塞状态？

看来之前的图我白画了， BlockingQueue听说过没有？没听说过？其实很简单，就是一个线程调用它的take()方法取数据时，如果这个Queue中没有数据，该线程会阻塞；同样，一个线程调用它的put方法放数据时，如果Queue满了，也会阻塞。

小白科普：线程和线程池

奥，看来线程池中每个线程的run（）方法中，要设置一个循环，每次都尝试从BlockingQueue中获取任务，如果Queue是空的，就阻塞等待，如果有任务来了，就会通知到线程池的某一个线程去处理，处理完了以后，依然试图从BlockingQueue中获取任务，就这么依次循环下去。

线程池中的Worker线程：
public class WorkerThread extends Thread {

    private BlockingQueue<Task> taskQueue = null;
    private boolean       isStopped = false;
    //持有一个BlockingQueue的实例
    public WorkerThread(BlockingQueue<Task> queue){
        taskQueue = queue;
    }

    public void run(){
        while(!isStopped()){
            try{
                Task task = taskQueue.take();
                task.execute();
            } catch(Exception e){
                //log or otherwise report exception,
                //but keep pool thread alive.
            }
        }
    }
    ......略......
}

没错，你这个代码是一种简单的实现，我的老朋友Doug Lea大师写了一套非常好的实现，已经被吸收进JDK了，作为java.util.concurrent包的一部分，你直接调用即可，不用自己动手了。

ExecutorService executorService = Executors.newFixedThreadPool(10);

executorService.execute(new Runnable() {
    public void run() {
        System.out.println("Asynchronous task");
    }
});

executorService.shutdown();

（完）

你看到的只是冰山一角，更多精彩文章，请移步《》或者《》

码农翻身

用故事讲述技术

以上是关于小白科普：线程和线程池的主要内容，如果未能解决你的问题，请参考以下文章

python小白学习记录多线程爬取ts片段

Java——线程池

Java线程池详解

Java 线程池详解

小白成长之路：初识python --python线程池