ForkJoinPool.commonPool() 和 new ForkJoinPool(availableCPU - 1) 有啥区别?

Posted

技术标签:

【中文标题】ForkJoinPool.commonPool() 和 new ForkJoinPool(availableCPU - 1) 有啥区别?【英文标题】:What is the difference between ForkJoinPool.commonPool() and new ForkJoinPool(availableCPU - 1)?ForkJoinPool.commonPool() 和 new ForkJoinPool(availableCPU - 1) 有什么区别? 【发布时间】:2019-02-04 22:38:46 【问题描述】:

在我的代码中,我有一个包含静态最终变量的类

private static final ForkJoinPool pool = new ForkJoinPool(availableCPUs - 1);

我有一个长时间运行的任务提交到池中,这将占用所有 CPU 资源。提交的任何其他任务都将挂起。 但是,当我切换到创建一个公共池时

private static final ForkJoinPool pool = ForkJoinPool.commonPool();

所有任务都可以提交执行。

我只是想知道这两段代码之间有什么区别。 commonPool() 仍然调用new ForkJoinPool() 并传递availableCPUs - 1

我还注意到commonPool() 使用SafeForkJoinWorkerThreadFactory 类型的工厂,而new ForkJoinPool() 使用ForkJoinPool$DefaultForkJoinWorkerThreadFactory。这有关系吗?

非常感谢!

【问题讨论】:

【参考方案1】:

我想我明白了。

ForkJoin 维护两种类型的队列:一种是通用入站队列,另一种是每个工作线程的工作线程队列。所有工作线程将首先从一般入站队列中获取并填充它们的工作线程。在一个工作线程完成其工作队列中的所有任务后,它将尝试从其他工作线程中窃取。如果没有其他任务可以从其他工作线程中窃取,工作线程将再次从通用入站队列中获取。

但是,使用公共池,主线程也将有助于处理任务。主线程虽然没有工作队列。因此,在完成一项任务后,主线程将能够从一般入站队列中获取。

由于默认情况下,ForkJoin 队列是 LIFO,因此主线程将能够获取最后提交的任务。

【讨论】:

【参考方案2】:

Documentation 说:

默认情况下,公共池是使用默认参数构造的。

ForkJoinPool()

使用default thread factory、无 UncaughtExceptionHandler 和非异步 LIFO 处理模式创建一个并行度等于 Runtime.availableProcessors()ForkJoinPool

那么是什么让您认为 new ForkJoinPool(availableCPUs - 1)ForkJoinPool.commonPool() 会是相同大小的池?

如果您只有 2 个 CPU,那么availableCPUs - 1 表示您正在创建一个包含 1 个线程的池,即一次只能处理一个任务,因此长时间运行的任务会阻塞所有其他任务。

但是对于 2 个 CPU,availableProcessors() 意味着您将获得一个具有 2 个线程的公共池,即它可以在处理单个长时间运行的任务时处理其他任务。

【讨论】:

如果你查看 ForkJoinPool.java 的 makeCommonPool() 方法的源代码,你会注意到它实际上是使用 availableCPUs - 1 来创建公共池。此外,我的初始代码使用了没有参数的 ForkJoinPool(),它也有同样的问题。

以上是关于ForkJoinPool.commonPool() 和 new ForkJoinPool(availableCPU - 1) 有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章