如何在 R 中并行运行多个内核上的 randomForest? [复制]
Posted
技术标签:
【中文标题】如何在 R 中并行运行多个内核上的 randomForest? [复制]【英文标题】:How to run randomForest in R on multiple cores in parallel? [duplicate] 【发布时间】:2018-10-04 09:17:46 【问题描述】:我有一个要在多个核心上计算的 randomForest 模型。 如何让模型并行运行?
这不是 parallel execution of random forest in R 的重复,因为我不需要并行运行多个模型,我希望一个模型并行运行。
【问题讨论】:
@Florian 没问题,但请确认与运行完整模型相比,联合收割机是否能做到这一点。我的意思是,如果我将运行 foreach 并使用 1000 棵树的 5 次“迭代”并将其组合起来,就像用 ntree = 5000 做一个 randomForest 一样? 据我所知;它们是等价的。随机森林只是生长具有一定随机性的独立树,因此这些树是否生长在不同的森林中并不重要。例如,如果我们种植增强型森林,情况就不同了,树木不再独立生长,而是按顺序生长。 使用ranger
或rborist
会有所帮助。更快且开箱即用的并行化。
【参考方案1】:
我使用doMC
包及其registerDoMC
函数。效果很好。
【讨论】:
以上是关于如何在 R 中并行运行多个内核上的 randomForest? [复制]的主要内容,如果未能解决你的问题,请参考以下文章
如何在机器人框架中并行运行多个测试套件上的多个测试用例 | Python