如何在 R 中并行运行多个内核上的 randomForest? [复制]

Posted

技术标签:

【中文标题】如何在 R 中并行运行多个内核上的 randomForest? [复制]【英文标题】:How to run randomForest in R on multiple cores in parallel? [duplicate] 【发布时间】:2018-10-04 09:17:46 【问题描述】:

我有一个要在多个核心上计算的 randomForest 模型。 如何让模型并行运行?

这不是 parallel execution of random forest in R 的重复,因为我不需要并行运行多个模型,我希望一个模型并行运行。

【问题讨论】:

@Florian 没问题,但请确认与运行完整模型相比,联合收割机是否能做到这一点。我的意思是,如果我将运行 foreach 并使用 1000 棵树的 5 次“迭代”并将其组合起来,就像用 ntree = 5000 做一个 randomForest 一样? 据我所知;它们是等价的。随机森林只是生长具有一定随机性的独立树,因此这些树是否生长在不同的森林中并不重要。例如,如果我们种植增强型森林,情况就不同了,树木不再独立生长,而是按顺序生长。 使用rangerrborist 会有所帮助。更快且开箱即用的并行化。 【参考方案1】:

我使用doMC 包及其registerDoMC 函数。效果很好。

【讨论】:

以上是关于如何在 R 中并行运行多个内核上的 randomForest? [复制]的主要内容,如果未能解决你的问题,请参考以下文章

如何在机器人框架中并行运行多个测试套件上的多个测试用例 | Python

在 ARM / Raspberry PI 上的多个内核上运行 Eigen 密集矩阵乘法时性能下降

R中的并行计算:如何使用内核

并发编程

在多个主机上运行并行 R [关闭]

38并发编程